当前位置:主页 > 管理论文 > 移动网络论文 >

微博热点话题抽取及其情感分类

发布时间:2018-04-18 17:00

  本文选题:微博 + 话题抽取 ; 参考:《哈尔滨工业大学》2014年硕士论文


【摘要】:随着Web2.0时代的到来,尤其是社交媒体的飞速发展,越来越多的互联网用户开始在网上发布自己对一些话题的看法。如何从海量的数据中抽取出当前的热门话题,并就用户对该话题的看法进行分析成为一个非常有意义的研究点。本文就针对这个研究点进行了深入的分析。 微博热点话题与普通话题的定义有所不同。在微博中,热点话题是指在短时间内被大量用户高度关注的话题。这些话题可以是真实的社会事件,也可以与社会事件无关,但仍在短时间内获得了很高的兴趣度,为大量微博用户所关注讨论。 本文将该研究点分成两阶段任务:微博热点话题抽取与话题情感分类。 关于微博热点话题抽取,本文提出了基于话题标签的微博热点话题抽取算法。该算法利用启发式规则和聚类算法来实时抽取微博热点话题。算法主要包括三个部分:话题发现、话题聚类以及话题排序。实验证明该方法抽取的微博热点话题具有很高的准确率。 关于话题情感分类,,本文提出了基于篇章关系的微博情感分类算法。该算法共归纳出四种可能对情感分类的结果产生影响的篇章关系,并利用与这些篇章关系相对应的关系指示词来识别微博文本的主干成分。在此基础之上,探索了多种不同类别的微博情感分类特征。此外,本文还构建了一个面向微博领域的大规模情感词典。实验结果表明,本文提出的算法在微博情感分类上能够取得不错的效果。 此外,我们还将上述的两个算法有机融合,构建了一个用户情绪在线分析平台。该平台能够实时的分析微博热点话题,并就广大用户针对这些话题的情感分布进行分析,具有十分重要的意义。
[Abstract]:With the advent of the Web2.0 era, especially the rapid development of social media, more and more Internet users begin to publish their views on some topics online.How to extract the current hot topic from the massive data and analyze the user's views on the topic has become a very meaningful research point.This article has carried on the thorough analysis to this research point.Weibo's definition of hot topic is different from that of ordinary topic.In Weibo, hot topic refers to the topic that is highly concerned by a large number of users in a short period of time.These topics can be real social events, or not related to social events, but in a short period of time has gained a high degree of interest, which has attracted a large number of Weibo users.This paper divides the research point into two tasks: Weibo hot topic extraction and topic emotion classification.In this paper, a topic extraction algorithm based on topic label is proposed for Weibo hot topic extraction.The algorithm uses heuristic rules and clustering algorithm to extract Weibo hot topics in real time.The algorithm includes three parts: topic discovery, topic clustering and topic sorting.Experimental results show that the proposed method has a high accuracy in extracting hot topics from Weibo.On topic emotion classification, this paper proposes Weibo emotion classification algorithm based on text relationship.The algorithm induces four kinds of text relations which may have an effect on the result of emotion classification, and identifies the main components of Weibo's text by using the relational deixis corresponding to these text relations.On the basis of this, this paper explores the characteristics of Weibo's emotional classification in different categories.In addition, this paper also constructs a large-scale emotion dictionary for Weibo.Experimental results show that the proposed algorithm can achieve good results in Weibo emotional classification.In addition, we combine the above two algorithms organically and construct an online analysis platform for user sentiment.The platform can analyze Weibo hot topics in real time and analyze the emotional distribution of these topics by the majority of users, which is of great significance.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092

【共引文献】

相关期刊论文 前10条

1 陆蓓;程肖;谌志群;;互联网舆情挖掘研究述略[J];情报资料工作;2010年02期

2 龙志yN;程葳;;基于词聚类的热点话题检测算法[J];计算机工程与设计;2011年06期

3 康小利;;基于时序的突发事件跟踪研究[J];数字技术与应用;2011年04期

4 刘霁;周亚东;高峰;赵俊舟;薛峰;;一种基于文本语义的网络敏感话题识别方法[J];深圳信息职业技术学院学报;2011年03期

5 饶洋辉;叶良;常红旭;程洁;;新话题监测研究进展[J];图书馆杂志;2009年07期

6 王振宇;吴泽衡;唐远华;;基于多向量和二次聚类的话题检测[J];计算机工程与设计;2012年08期

7 王卫姣;;话题追踪技术研究综述[J];软件导刊;2013年04期

8 刘权;郭武;;基于核主成分分析的话题跟踪系统[J];清华大学学报(自然科学版);2013年06期

9 周学广;高飞;孙艳;;基于依存连接权VSM的子话题检测与跟踪方法[J];通信学报;2013年08期

10 翟东海;鱼江;聂洪玉;崔静静;杜佳;;基于相关性反馈的自适应热点话题追踪模型[J];山东大学学报(工学版);2014年01期

相关会议论文 前8条

1 彭楠峗;王厚峰;凌晨添;;基于层次聚类的网络新闻热点发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 刘星星;何婷婷;龚海军;陈龙;;网络热点事件发现系统的设计[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

3 楚克明;李芳;;基于LDA新闻话题的演化[A];第五届全国信息检索学术会议论文集[C];2009年

4 李恒训;张华平;秦鹏;于满泉;刘金刚;;基于主题词的网络热点话题发现[A];第五届全国信息检索学术会议论文集[C];2009年

5 单斌;李芳;;基于种子文档和话题模型的话题演化研究[A];第六届全国信息检索学术会议论文集[C];2010年

6 曹俊喜;刘云;徐希源;;电力行业网络舆情监测分析技术研究与系统设计[A];2012年电力通信管理暨智能电网通信技术论坛论文集[C];2013年

7 刘培玉;张朕;朱振方;;融合微博特征的网络热点话题热度计算方法的研究[A];山东计算机学会2013学术年会论文集[C];2013年

8 刘权;郭武;;基于核主成分分析的话题跟踪系统[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

相关博士学位论文 前10条

1 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年

2 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年

3 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年

4 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年

5 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年

6 钟茂生;基于内容相关度计算的文本结构分析方法研究[D];上海交通大学;2010年

7 付剑锋;面向事件的知识处理研究[D];上海大学;2010年

8 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年

9 田野;基于微博平台的事件趋势分析及预测研究[D];武汉大学;2012年

10 陆铭;WEB2.0网络热点发现与个性化检索研究[D];中国科学技术大学;2012年

相关硕士学位论文 前10条

1 赵慧杰;面向论坛的话题发现、跟踪及传播技术研究[D];哈尔滨工程大学;2010年

2 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年

3 印文涛;基于星型K部图的网络视频话题挖掘和可视化的研究[D];浙江大学;2011年

4 白志杰;新闻视频主题追踪技术研究[D];解放军信息工程大学;2009年

5 刘嵩;网络中文事件自动检测技术研究[D];解放军信息工程大学;2010年

6 李恒训;网络论坛采集及热点话题发现研究[D];首都师范大学;2011年

7 兰凯梅;BBS热点话题发现与监控系统[D];北京交通大学;2011年

8 孙胜平;中文微博客热点话题检测与跟踪技术研究[D];北京交通大学;2011年

9 刘晓东;话题检测与跟踪系统的构建[D];北京邮电大学;2011年

10 吴泽衡;基于话题检测和情感分析的互联网热点分析与监控技术研究[D];华南理工大学;2011年



本文编号:1769265

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1769265.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9963a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com