当前位置:主页 > 经济论文 > 经济管理论文 >

大量网络游记文本中热度地名提取方法与实证研究

发布时间:2017-06-02 18:06

  本文关键词:大量网络游记文本中热度地名提取方法与实证研究,由笔耕文化传播整理发布。


【摘要】:探讨网络游记文本中的地名使用特征及其研究意义,地名使用状态的定量特征能够反映游客对旅游地景观的认知结构与旅游行为的一般过程。在现有中文分词技术基础上,结合游记文本中的地名使用特点,选用ATF*PDF方法计算特征词汇在整个旅游文本集中使用状态的综合权重,设计了一种基于大量网络游记文本的热度地名自动提取方法,为不使用自定义地名库的旅游地理研究奠定了基础。以游客点评网游记为样本的实验证明,该方法能够实现旅游相关地名的快速提取,地名使用热度越高,提取准确率越高;对地名提取结果的类型结构分析发现了自然和人文旅游地游记在词汇使用方面的共性和差异,指示了旅游文本地名的分布意义及其对旅行过程其他信息解读的潜在价值,预示了网络游记文本在进一步解析旅游者的旅游地认知特征和旅游行为过程方面的科学意义。
【作者单位】: 河北师范大学资源与环境科学学院;河北省科学院地理科学研究所;河北省环境演变与生态建设实验室;
【关键词】网络游记文本 热度地名 ATF*PDF模型 多样本集合共现
【基金】:国家自然科学基金项目(41101105、41171105) 河北省软科学研究计划项目(13406002D) 河北省高校重点学科建设项目
【分类号】:F592;F224
【正文快照】: 0引言网络游记是旅游者基于自身旅游体验主动发表在互联网中主要描述旅行过程和感受的文本,其相比问卷调查和访谈更能够代表游客的真实态度[1],可以作为旅游地研究的重要数据来源[2]。目前,国内外以互联网游记文本为数据源的旅游地研究越来越多,主要关注旅游者行为及其对旅游

【参考文献】

中国期刊全文数据库 前10条

1 刘瑜;张毅;田原;薛露露;;广义地名及其本体研究[J];地理与地理信息科学;2007年06期

2 张雪英;张春菊;闾国年;;地理命名实体分类体系的设计与应用分析[J];地球信息科学学报;2010年02期

3 张春菊;张雪英;朱少楠;徐希涛;;基于网络爬虫的地名数据库维护方法[J];地球信息科学学报;2011年04期

4 王佳果;王尧;;基于NVivo软件的互联网旅游文本的质性研究——以贵州黔东南肇兴的旅游者文本为例[J];旅游论坛;2009年01期

5 唐顺英;周尚意;;文本在游客地方感建构中的作用研究——基于曲阜游记的分析[J];地理与地理信息科学;2013年02期

6 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期

7 胡志敏;;基于综合权重的多文档关键词抽取算法[J];计算机与数字工程;2010年06期

8 苗学玲;保继刚;;“众乐乐”:旅游虚拟社区“结伴旅行”之质性研究[J];旅游学刊;2007年08期

9 肖亮;赵黎明;;互联网传播的台湾旅游目的地形象——基于两岸相关网站的内容分析[J];旅游学刊;2009年03期

10 黄德根,岳广玲,杨元生;基于统计的中文地名识别[J];中文信息学报;2003年02期

【共引文献】

中国期刊全文数据库 前10条

1 于江德;王希杰;;词位标注汉语分词技术详解[J];安阳师范学院学报;2010年05期

2 杨尔弘;;媒体5年词语使用情况调查分析[J];北华大学学报(社会科学版);2011年04期

3 付艳;杨冬青;唐世渭;伍伟;王腾蛟;高军;;基于实体识别的在线主题检测方法[J];北京大学学报(自然科学版);2009年02期

4 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期

5 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期

6 李玉森;张雪英;袁正午;;面向GIS的地理命名实体识别研究[J];重庆邮电大学学报(自然科学版);2008年06期

7 傅鹂;孙坚;付春雷;;基于语义的音乐检索系统[J];重庆理工大学学报(自然科学版);2011年01期

8 张雪英;朱少楠;徐希涛;;基于Neogeography的中文地名词典维护和服务机制[J];测绘通报;2012年01期

9 张雪英;朱少楠;张春菊;;中文文本的地理命名实体标注[J];测绘学报;2012年01期

10 高东平;;基于类型论的汉语分词系统TTCS[J];重庆理工大学学报(社会科学);2011年08期

中国重要会议论文全文数据库 前10条

1 李金;宋阳;梁洪;;语言残障患者医疗辅助系统设计[A];第九届全国信息获取与处理学术会议论文集Ⅱ[C];2011年

2 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

4 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

5 余骁捷;邵阳;吴及;王侠;;基于SVM和MMR融和的自动文摘方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

6 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年

7 李玉梅;靳光瑾;黄昌宁;;中文分词规范中的歧义字段消解细则[A];第五届全国语言文字应用学术研讨会论文集[C];2007年

8 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年

9 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年

10 张sソ,

本文编号:416091


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/416091.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户546ab***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com