当前位置:主页 > 管理论文 > 移动网络论文 >

微博新闻话题的情感分析研究

发布时间:2024-02-14 03:15
  当前微博已经成为人们发表意见、表达情感的最重要的一种渠道,微博中产生的大量带有情感的信息,反映了人们对热点事件、热点话题的褒贬倾向。因此对微博中这些情感文本进行挖掘和分析已经成为当前的一个研究热点。 本文通过话题识别技术和情感分析技术对微博中的新闻话题进行分析。使用话题识别技术从海量的微博数据中发现热点新闻话题;并与情感分析技术结合,分析监测热点话题的情感极性和情感强度,及时把握广大网民对热点话题的看法和评价,可以有效的帮助政府职能部门了解民意,便于决策者做出决策。 针对传统的话题检测算法主要适用于新闻网页和博客等长文本信息,而不能有效处理具有稀疏性的微博数据,给出一种基于词共现图的方法来识别微博中的新闻话题。该方法首先在微博数据预处理之后,综合相对词频和词频增加率两个因素抽取微博数据中的主题词;然后根据主题词间的共现度构建词共现图,把词共现图中每个不连通的簇集看成一个新闻话题,并使用每个簇集中包含信息量较大的几个主题词来表示微博新闻话题。最后在微博数据集上进行实验,实现了对微博中新闻话题的识别,验证了基于词共现图方法的有效性。 针对微博的情感分析研究得到了越来越多的关注,本文根据中文...

【文章页数】:48 页

【学位级别】:硕士

【部分图文】:

图2-1医患的概念网络图

图2-1医患的概念网络图

类似字典和词汇表的知识库,只是它拥有着更明确的内容的结构。一个本体是概念、公理、描述兴趣领域本体局限于概念是抽象的、哲学的、通用的,元数据词汇的本体知识库。面,知网给出了“义原”的基本概念。义原可以看作割的最小的一个语义单元。因为在汉语中一个“词”多彩,通常一个词在放在不同的语言....


图3-1预处理过程

图3-1预处理过程

图3-1预处理过程处理过程中非常重要的一步,对后续的文本聚类、分类词相比,中文文本中的词与词之间并不存在明显的划分文本的第一个问题就是把每个句子的词都分离出来,也目的在于把微博文本处理和转化成计算机能够识别和理处理过程要用到分词算法。汉语分词的方法通常分为机类。年代以来,大量....


图3-2单连通图G

图3-2单连通图G

本文根据主题词之间的共现度构建词共现图,在词共现图的基础上个连通的子图看成一个簇集,簇集内部是连通的,而不同的簇集之间是不连时每个不连通的簇集对应微博中一个新闻话题,通过对词共现图中簇集的划成微博新闻话题的识别。根据上述思想,下面给出识别微博新闻话题的基本(1)主题词共现图中点集....


图3-3多连通图G

图3-3多连通图G

本文根据主题词之间的共现度构建词共现图,在词共现图的基础上个连通的子图看成一个簇集,簇集内部是连通的,而不同的簇集之间是不连时每个不连通的簇集对应微博中一个新闻话题,通过对词共现图中簇集的划成微博新闻话题的识别。根据上述思想,下面给出识别微博新闻话题的基本(1)主题词共现图中点集....



本文编号:3897654

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3897654.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户34982***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com