当前位置:主页 > 科技论文 > 软件论文 >

基于微博的细粒度情感分析

发布时间:2018-12-12 08:06
【摘要】:【目的】对微博进行细粒度情感分析,将情感分为8类,并计算其情感强度值,从而尽可能还原微博用户情感。【方法】通过微博语料分析构建疑问词词表,在大连理工大学情感词汇本体DUTIR的7类情感基础上,丰富一类情感"疑",并利用点互信息法构建表情符号词典,还综合考虑否定词和程度副词对情感表达的影响,利用Python从新浪微博上获取数据,并用R语言的jieba R包进行分词,对情感进行分类并计算其强度。【结果】得到微博用户对于糖尿病7类常用药物的8类情感占比及情感强度,并通过正确率、召回率、F值对结果进行验证,其中"怒"和"哀"的正确率最高,分别为85.73%和83.05%,而"乐"和"好"的召回率与F值均最高,为81%以上。本文新增情感"疑"的正确率、召回率、F值分别为77.33%、78.58%、77.95%,均值在8类情感中排名前列,说明其情感识别较好。【局限】由于本文依赖于情感词典进行情感分析,因此为了更好的分析结果,情感词典仍需进一步完善。【结论】本方法具有较高的识别率和可靠性,能够更好地对微博上的情感分类进行细粒度分析。
[Abstract]:[objective] to analyze the fine granularity emotion of Weibo, divide the emotion into 8 categories, and calculate the emotion intensity value, so as to restore the user emotion as much as possible. [methods] the lexicon of interrogative words was constructed by analyzing the data of Weibo. On the basis of seven kinds of emotion of DUTIR, Dalian University of Technology, this paper enriches a kind of emotion "doubt", constructs an emoji dictionary with the method of point mutual information, and synthetically considers the influence of negative words and degree adverbs on emotion expression. Python was used to obtain data from Sina Weibo, and jieba R package in R language was used to classify emotion and calculate its intensity. [results] eight kinds of emotion and emotional intensity of Weibo users for 7 kinds of commonly used drugs for diabetes mellitus were obtained. The correct rate of "anger" and "sorrow" were 85.73% and 83.05, respectively, while the recall rate of "Yue" and "good" and F value were the highest (above 81%). In this paper, the correct rate, recall rate and F value of the new affective "suspicion" are 77.33 and 78.58, respectively. It shows that the emotion recognition is better. [limitation] because this paper relies on emotion dictionary for emotion analysis, in order to better analyze the result, the emotion dictionary still needs to be further improved. [conclusion] this method has high recognition rate and reliability. Can better carry on fine-grained analysis to the emotion classification on Weibo.
【作者单位】: 吉林大学公共卫生学院;大连理工大学中日国际信息与软件学院;
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 王宁;钞柯;罗嫔;;实现细粒度访问控制的元模型研究[J];大连理工大学学报;2012年03期

2 欧阳纯萍;阳小华;雷龙艳;徐强;余颖;刘志明;;多策略中文微博细粒度情绪分析研究[J];北京大学学报(自然科学版);2014年01期

3 史大伟;袁天伟;;一种粗细粒度结合的动态污点分析方法[J];计算机工程;2014年03期

4 原子;于莉莉;刘超;;引入缺陷的细粒度软件变更识别方法[J];北京航空航天大学学报;2014年09期

5 涂登彪;谭光明;孙凝晖;;无锁同步的细粒度并行介度中心算法[J];软件学报;2011年05期

6 华秀丽;徐凡;王中卿;李培峰;;细粒度科技论文摘要句子分类方法[J];计算机工程;2012年14期

7 时杰;朱虹;冯玉才;;实现数据库细粒度访问控制的一种动态查询修改算法[J];计算机科学;2010年12期

8 王志强;黄皓;夏磊;;进程内细粒度保护域模型及其实现[J];计算机应用;2007年06期

9 赵亚杰;陈龙;;面向手机取证的细粒度数据完整性检验方法[J];计算机工程与设计;2012年11期

10 王希忠;曲家兴;马春光;周长利;;一种适用于非结构化数据的改进细粒度加密方法[J];计算机应用研究;2014年09期

相关会议论文 前1条

1 盛振华;吴羽;江锦华;寿黎但;陈刚;;InfoSigs:一种面向WEB对象的细粒度聚类算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

相关博士学位论文 前3条

1 时杰;关系数据库细粒度访问控制研究[D];华中科技大学;2010年

2 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年

3 余a\;基于Simulink模型的细粒度多线程技术研究[D];浙江大学;2014年

相关硕士学位论文 前10条

1 赵黎光;基于依存句法的句子级细粒度情感计算[D];华南理工大学;2015年

2 姚亮;数据访问控制中基于中间代理的用户撤销方法[D];西安电子科技大学;2014年

3 占文平;面向产品评论的情感分析技术研究[D];浙江工商大学;2015年

4 廖纯;基于句法和语义的话题细粒度情感分析的研究[D];北京理工大学;2016年

5 李毅;属性层级观点挖掘技术的研究与应用[D];石家庄铁道大学;2016年

6 周志华;聊天系统文本情感细粒度分类研究与应用[D];西南交通大学;2015年

7 康海蒙;基于细粒度监控的Spark优化研究[D];哈尔滨工业大学;2016年

8 陈闯闯;中文微博细粒度情感判别研究[D];南华大学;2016年

9 付连鹏;微博客细粒度情感分析技术的研究与实现[D];东北大学;2014年

10 李凌云;基于部件对齐模型的细粒度分类方法研究[D];大连理工大学;2016年



本文编号:2374235

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2374235.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2a76f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com