领域知识在旅游网络舆情分析中的应用研究
本文关键词: 云南旅游 热点话题 领域本体 特征提取 网络舆情 出处:《云南财经大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着人们生活质量的不断提高,旅游行业迅速崛起,在国民经济中占据着举足轻重的地位。云南省顺应时代的发展,在当前的发展优势下紧紧抓住这个机遇,大力发展旅游业,现已成为国内外知名的旅游胜地。信息技术随着经济的发展而进步,互联网技术的快速发展和智能手机的普及导致使用社交软件的门槛越来越低,各大社交网站已经成为了各种有关云南旅游声音汇聚的重要场所。众多网民针对网络旅游话题所持有的代表性意见随着网络舆论对旅游业影响力的不断提升而扩大,在这种局势下,微博以其简单方便快捷的优点迅速成为人们感兴趣的平台,渐渐成为旅游网络舆情的主要传播途径之一。为了长期维护云南旅游业的安全稳定和健康发展,发现微博上的云南旅游热点话题并对旅游网络舆情的演化趋势进行分析预测具有重大的现实意义。本文研究的主要内容是:如何将网民们关注的旅游热点话题从复杂的、分散的网络数据中提取出来;如何解析提取出来的旅游热点话题的信息,并以此来分析该话题的演化趋势。目前发现网络热点话题的大多数研究方法都是通过文本挖掘技术解释信息内容,并发现这些信息之间的关系,进而挖掘出虚拟网络中的网民们关注的热点话题,但是效果都不是很理想,尤其在不同的领域,同样的挖掘方法得到的结果却不如人意。本文根据现在研究的不足,针对具体领域构建领域本体,并将该领域本体应用在舆情分析中的数据处理、文本建模和话题聚类等过程中,从而发现人们关注度高的话题,最后按照人们对话题关注的热度为话题排序,从而得到热点话题。在此基础上,综合其他学科的相关理论来分析热点话题的形成机制和演化特点来预测热点话题的演化趋势。本文在研究中所做的创新性工作如下:(1)基于云南旅游这个具体的领域构建领域本体。(2)在深入研究特征提取算法的基础上,提出一种基于领域本体的特征提取算法。该方法融合领域本体与TF-IDF方法,对本体推理从而优化特征抽取,用改进过的TF-IDF公式来计算特征词的权重。利用传统算法和改进后的算法进行实验,实验结果对比表明了该优化算法提高了特征抽取的正确率,证明了它是一种有效提取特征的方法。(3)依据微博评论数、点赞数和转发数三者的调和数对旅游话题的热度进行评定,按照评估值对话题排序,将排序的结果与微博官方公布的排行进行比对,从而验证了该评估法的有效性。
[Abstract]:With the continuous improvement of people's quality of life and the rapid rise of the tourism industry, it occupies a pivotal position in the national economy. Yunnan Province conforms to the development of the times, grasps this opportunity tightly under the current development superiority, vigorously develops the tourism industry, It has become a well-known tourist destination at home and abroad. With the development of economy, the rapid development of Internet technology and the popularity of smartphones, the barriers to using social software are getting lower and lower. The major social networking sites have become important places for the gathering of various tourist voices in Yunnan. The representative opinions held by many netizens on the topic of online tourism have expanded with the increasing influence of Internet public opinion on tourism. In this situation, Weibo, with its simple, convenient and quick advantages, quickly became a platform of interest to people, and gradually became one of the main channels of dissemination of public opinion on the tourism network. In order to maintain the security, stability and healthy development of Yunnan's tourism industry for a long time, It is of great practical significance to find the hot topic of Yunnan tourism on Weibo and to analyze and predict the evolution trend of tourism network public opinion. Extract from scattered network data; how to parse extracted information on hot tourist topics, At present, most of the research methods to find the hot topics on the Internet are to interpret the information content through text mining technology, and to find the relationship between these information. The results of the same mining methods are not satisfactory, especially in different fields. According to the deficiency of the present research, this paper is based on the deficiency of the present research. The domain ontology is constructed according to the specific domain, and applied in the process of data processing, text modeling and topic clustering in the analysis of public opinion. Finally, the hot topics are sorted according to the heat that people pay attention to, and then the hot topics are obtained. On this basis, Based on the relevant theories of other disciplines, this paper analyzes the formation mechanism and evolution characteristics of hot topics to predict the evolution trend of hot topics. The innovative work done in this paper is as follows: 1) based on Yunnan tourism. Domain building domain ontology. 2) based on the in-depth study of feature extraction algorithm, A feature extraction algorithm based on domain ontology is proposed, which combines domain ontology with TF-IDF method and optimizes feature extraction by reasoning ontology. The weight of feature words is calculated by using the improved TF-IDF formula. The experimental results show that the proposed algorithm improves the accuracy of feature extraction by using the traditional algorithm and the improved algorithm. It is proved that it is an effective method to extract features.) according to the harmonic numbers of Weibo comment number, likes number and forwarding number, the heat of tourist topics is evaluated, and the topics are sorted according to the evaluation value. The ranking results were compared with Weibo's official ranking to verify the effectiveness of the evaluation method.
【学位授予单位】:云南财经大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1
【参考文献】
相关期刊论文 前10条
1 陈婷;王雪怡;曲霏;陈福集;;基于时序主题的网络舆情热点话题演化分析方法[J];华中师范大学学报(自然科学版);2016年05期
2 陈福集;马梅兰;;网络舆情事件的话题演化分析——以成都女司机为例[J];情报杂志;2016年05期
3 李国;张春杰;张志远;;一种基于加权LDA模型的文本聚类方法[J];中国民航大学学报;2016年02期
4 李钊;李晓;王春梅;李诚;杨春;;一种基于MapReduce的文本聚类方法研究[J];计算机科学;2016年01期
5 董坚峰;肖丽艳;;旅游突发事件中的网络舆情预警研究[J];现代情报;2015年06期
6 付业勤;郑向敏;雷春;郑文标;;旅游危机事件网络舆情的本体分析[J];重庆理工大学学报(社会科学);2015年02期
7 周泓;刘金岭;王新功;;基于短文本信息流的回顾式话题识别模型[J];中文信息学报;2015年01期
8 陈卓群;;基于共词网络的社交媒体话题演化分析[J];情报科学;2015年01期
9 曾润喜;王晨曦;陈强;;网络舆情传播阶段与模型比较研究[J];情报杂志;2014年05期
10 赵旭剑;杨春明;李波;张晖;金培权;岳丽华;戴文锴;;一种基于特征演变的新闻话题演化挖掘方法[J];计算机学报;2014年04期
相关博士学位论文 前2条
1 赵晨阳;个性化旅游信息服务系统的基础理论与关键技术研究[D];兰州大学;2012年
2 高田;基于领域知识的旅游突发事件状态评估与演化研究[D];北京邮电大学;2011年
相关硕士学位论文 前6条
1 贺源;基于微博的热点话题发现研究[D];石家庄铁道大学;2016年
2 张猛;基于领域本体的个性化旅游推荐系统的研究与实现[D];重庆大学;2015年
3 高丹丹;学科知识本体的构建及其应用[D];电子科技大学;2014年
4 李岩;基于微博的网络热点发现研究[D];江苏科技大学;2013年
5 单月光;基于微博的网络舆情关键技术的研究与实现[D];电子科技大学;2013年
6 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
,本文编号:1506817
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1506817.html