网络舆论主题探测、追踪与分析关键技术研究
本文关键词: 网络舆情 主题探测 主题追踪 情感分析 出处:《山东财经大学》2013年硕士论文 论文类型:学位论文
【摘要】:随着互联网的高度普及化,互联网对我们现实生活的影响也越来越大。面对互联网中日益增长的海量信息,当用户想要针对某一主题进行及时的跟踪和了解时,,现存的互联网搜索引擎不足以满足用户的需要,舆情监控分析系统的出现能够很好的帮助用户对主题进行探测、追踪和分析。 本文主要了研究了网络舆情主题探测与追踪技术和网络舆情情感分析技术。首先研究了这几项技术的国内外的研究现状,然后对其中较为重要的几项技术进行了仔细的学习和比较,比如:文本表示模型、中文分析、特征权重计算方法和文本分类等。并在此基础上,提出了本文的创新点,包括: (1)基于事件演化的主题探测和主题追踪模型。针对目前舆情监控分析系统存在的主题漂移现象带来的问题,利用种子事件和新颖事件的演化关系,提出了改进的向量空间模型和文本分类算法,经过实验分析证明,本算法可以在一定程度上解决了由主题漂移带来的主题探测与追踪准确率降低的问题。 (2)基于事件多面性的情感倾向性分析。目前大多数的舆情监控分析系统的情感分析模块基本都是为了得到针对某一主题或事物评价信息整体的情感极性,而忽略了事物本身的多面性,本文通过抽取情感语句中的情感分析三元组实现对主题或事物评价信息的局部情感极性,使得情感倾向性分析功能模块更加完善。 (3)基于Hadoop平台的舆情监控分析系统的设计。针对目前海量的互联网信息,大数据的存储和运算成为舆情监控分析系统实现的重要环节之一,鉴于Hadoop平台在大数据存储和运算的优越性,本文以此为开发平台对舆情监控分析系统进行了设计。 本文通过对主题探测与追踪、情感倾向性分析技术的研究和探索,对两项技术有了深入的了解,并在此基础了针对目前已有的问题提出了改进,为舆情监控分析的研究工作提供了一定的技术支持,有着重要的理论意义。
[Abstract]:With the high popularity of the Internet, the impact of the Internet on our real life is growing. In the face of the growing mass of information in the Internet, when users want to track and understand a certain topic in a timely manner, The existing Internet search engine is not enough to meet the needs of users, the emergence of public opinion monitoring and analysis system can help users to detect, track and analyze topics. This paper mainly studies the technology of detecting and tracking the subject of network public opinion and the technology of emotion analysis of network public opinion. Firstly, the research status of these technologies at home and abroad is studied. Then several important techniques are carefully studied and compared, such as text representation model, Chinese analysis, feature weight calculation method and text classification. On this basis, the innovation of this paper is put forward, including:. 1) the theme detection and subject tracking model based on event evolution. Aiming at the problems caused by the topic drift phenomenon in the current public opinion monitoring and analysis system, the evolution relationship between seed events and novel events is used. An improved vector space model and a text classification algorithm are proposed. The experimental results show that the algorithm can solve the problem of low accuracy of topic detection and tracking caused by topic drift to some extent. (2) emotional orientation analysis based on multi-facets of events. At present, most of the emotion analysis modules of the monitoring and analyzing system of public opinion are basically to get the emotional polarity of the whole evaluation information for a certain subject or thing. In this paper, the emotion analysis triples are extracted from emotional sentences to realize the local emotional polarity of the subject or thing evaluation information, which makes the function module of emotional orientation analysis more perfect. The design of public opinion monitoring and analysis system based on Hadoop platform. According to the mass of Internet information, big data's storage and operation become one of the important links in the realization of public opinion monitoring and analysis system. In view of the superiority of Hadoop platform in big data's storage and operation, this paper designs a monitoring and analysis system for public opinion based on this platform. Through the research and exploration of theme detection and tracking, emotional orientation analysis technology, this paper has a deep understanding of the two technologies, and on the basis of this, some improvements have been put forward in view of the existing problems. It provides some technical support for the research of monitoring and analysis of public opinion, and has important theoretical significance.
【学位授予单位】:山东财经大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP393.09;TP391.1
【参考文献】
相关期刊论文 前10条
1 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
2 熊德兰;程菊明;田胜利;;基于HowNet的句子褒贬倾向性研究[J];计算机工程与应用;2008年22期
3 赵华;赵铁军;赵霞;;时间信息在话题检测中的应用研究[J];计算机科学;2008年01期
4 柴玉梅;熊德兰;昝红英;;Web文本褒贬倾向性分类研究[J];计算机工程;2006年17期
5 何凤英;;基于语义理解的中文博文倾向性分析[J];计算机应用;2011年08期
6 潘渊;李弼程;张先飞;;LS-SVM:一种有效的新闻主题追踪方法[J];计算机应用研究;2008年09期
7 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
8 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
9 王素格;李德玉;魏英杰;宋晓雷;;基于同义词的词汇情感倾向判别方法[J];中文信息学报;2009年05期
10 宋丹;王卫东;陈英;;基于改进向量空间模型的话题识别与跟踪[J];计算机技术与发展;2006年09期
相关会议论文 前1条
1 姚天f ;聂青阳;李建超;李林琳;娄德成;陈珂;付宇;;一个用于汉语汽车评论的意见挖掘系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
相关硕士学位论文 前1条
1 龚海军;网络热点话题自动发现技术研究[D];华中师范大学;2008年
本文编号:1537834
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1537834.html