当前位置:主页 > 管理论文 > 移动网络论文 >

面向中文微博文本的情感分类研究

发布时间:2019-07-18 05:52
【摘要】:随着网络媒体的迅猛发展,以微博为代表的信息发布与信息共享平台得到了普遍应用。在微博平台中包含着表明用户观点或态度的主观情感倾向性文本,主观情感倾向性微博在舆情监控、热点检测等领域具有潜在的应用价值。如何从微博中自动识别表明用户观点的主观微博文本,并判断该主观微博的情感倾向性成为本文研究的目的。 本文以中文微博情感分类为主线,展开了如下研究工作: (1)对微博情感词典的构建方法进行了研究。首先对现有情感词典在微博情感分类中的适用性进行了分析,,针对现有情感词典对微博中情感词覆盖度不高的问题,整合现有情感词典资源并提出了一种基于平滑的SO-PMI算法对微博情感词典进行了构建,最后对微博情感词典在微博情感分类中的分类性能进行了实验。实验结果表明,本文方法构建的微博情感词典在微博情感分类中具有较好的适用性。 (2)对主客观微博文本的分类进行了研究。针对现有主客观微博文本分类准确率不高的问题,利用词典与统计分析的方法对候选主观特征进行了抽取,对抽取的候选主观特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法选取了观点词、感叹号、网络词、语气词、形容词、程度词作为主客观分类特征,最后利用上述特征进行主客观分类实验。实验结果表明,上述特征在微博主客观分类中能达到较好的分类效果。 (3)对主观微博文本的情感特征选择进行了研究。首先通过候选情感特征词性表对候选情感特征进行了抽取,并采用微博情感词典对候选情感特征中的非情感噪音词进行过滤;然后,采用卡方(CHI)算法对过滤后的候选情感特征词进行情感特征选择,对卡方算法在进行情感特征选择时存在的局部不稳定性,提出了一种基于CHI-tfidf的情感特征选择算法,最后,进行相关实验,对算法的稳定性与有效性进行了验证。实验结果表明,本文提出的算法在进行情感特征选择时具有较好的稳定性,且当特征维数为300时,分类的准确率为0.794,较信息增益算法、基于微博情感词典的分类算法准确率要高。
文内图片:010~2013中国微博用户规模及增长趋势
图片说明: 络的快速发展,人们获取信息的方式发生了巨大的改变。广播、电视等成为人们获取信息的重要渠道。然而,社交外一种获取信息的便捷方式,人们可以通过网络获取自己点信息等。与传统媒体被动的接受信息方式相比,网络媒有主动性。不仅如此,互联网上庞大的信息量及快速的传大网民的青睐,网络媒体逐渐成为人们获取信息、传播信中,以微博为代表的信息发布与信息交流平台得到了普遍[1]发布的《中国互联网络发展状况统计报告》显示,截至民数量已达到 6.18 亿,其中使用微博的网民数量为 2.微博用户规模的统计结果(如图 1-1 所示)来看,中国微势。
文内图片:COAE2013 微博评测结果
图片说明: 届倾向性分析评测中,增加了对微博的倾向性分析的评测,其主要任务是从 52000 条微博中提交 12000 条含有表示用户观点的微博并判断其倾向性,在评测中,各参赛队伍的评测结果正、负面 F1 值如图 1-2 所示:图 1-2 COAE2013 微博评测结果从图 1-2 可以看出,在提交的 25 组评测结果中,正面和负面的 F1 值都低于 0.45,评测结果有待进一步提高。由于微博文本长度较短,评测数据集中噪音文本较多,且评测中缺乏应有的训练语料,因此 COAE2013 中微博倾向性评测的结果并不高,针对中文微博倾向性分析的研究有待进一步进行研究。1.4 研究思路在国内外已有研究的基础上,本文将微博情感分类看成是一个两次二分类问题,即微博主客观分类、主观文本的正、负面分类
【学位授予单位】:湖南工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092;TP391.1

【参考文献】

相关期刊论文 前5条

1 杨武;宋静静;唐继强;;中文微博情感分析中主客观句分类方法[J];重庆理工大学学报(自然科学);2013年01期

2 刘志明;刘鲁;;基于机器学习的中文微博情感分类实证研究[J];计算机工程与应用;2012年01期

3 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期

4 杨鼎;阳爱民;;一种基于情感词典和朴素贝叶斯的中文文本情感分类方法[J];计算机应用研究;2010年10期

5 朱艳辉;栗春亮;徐叶强;柳位平;;一种基于多重词典的中文文本情感特征抽取方法[J];湖南工业大学学报;2011年02期

相关博士学位论文 前1条

1 张冬梅;文本情感分类及观点摘要关键问题研究[D];山东大学;2012年



本文编号:2515676

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2515676.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3ff99***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com