情感词发现与极性权重自动计算算法研究
本文选题:情感词 切入点:情感权重 出处:《中文信息学报》2017年03期 论文类型:期刊论文
【摘要】:随着互联网电子商务和各种社交网络应用的快速发展,产生了大量的用户评价信息。为满足快速整理这些评价信息的需求,情感倾向性分析应运而生。情感词典是各类情感倾向性识别算法的基础,收集一部全面且权重合理的情感词典,往往可以简单快速而有效地解决情感分析问题。但情感词典规模有限,而网络上新的情感词层出不穷,语言使用不规范,人工整理耗时耗力。已有的情感词收集方法较复杂,且领域性强,收集的情感词可扩展性差。本文提出一种自动挖掘潜在情感词并计算其极性权重的算法,该算法与应用领域无关,具有良好的扩展性。该方法利用共现特性,基于朴素贝叶斯公式能检测出未知的情感词,并根据其情感权重值的大小判断其情感极性,可有效地扩展情感词典,将已有的情感词典进一步量化。在理论研究的基础上,本文分别针对京东、豆瓣及大众点评网三组评论语料做了实验,其结果的准确率都基本在90%以上,验证了该方法的有效性和实用性,为情感倾向性分析提供了知识库基础。
[Abstract]:With the rapid development of Internet e-commerce and various social network applications, a large amount of user evaluation information has been generated. Emotion dictionaries are the basis of all kinds of affective orientation recognition algorithms. It is often possible to solve affective analysis problems simply, quickly and effectively. However, the scale of affective dictionary is limited, and new affective words appear in endlessly on the Internet, language usage is not standardized, manual sorting is time-consuming and time-consuming, and the existing methods of collecting affective words are more complicated. This paper presents an algorithm for automatically mining latent affective words and calculating their polar weights, which is independent of the application field and has good expansibility. Based on naive Bayes formula, unknown affective words can be detected, and their affective polarity can be judged according to their emotional weight, which can effectively expand the emotional dictionary and further quantify the existing affective lexicon. In this paper, three groups of comment corpus, JingDong, Douban and Dianping, are tested, and the accuracy of the results is above 90%, which verifies the validity and practicability of this method and provides a knowledge base for emotional orientation analysis.
【作者单位】: 北京理工大学计算机学院;北京市海量语言信息处理与云计算应用工程研究中心;公安部第一研究所信安部;工业和信息化部电子科学技术情报研究所;
【基金】:国家重点基础研究发展计划(973计划)(2013CB329601)
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 孙艳;周学广;付伟;;基于依存关联分析的情感词扩展[J];北京邮电大学学报;2012年05期
2 肖健;徐建;朱姝;万缨;许亮;;基于翻译和语义方法的情感词挖掘研究[J];计算机工程与应用;2011年32期
3 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期
4 代大明;李寿山;李培峰;朱巧明;;基于情绪词与情感词协作学习的情感分类方法研究[J];计算机科学;2012年12期
5 李勇敢;周学广;孙艳;张焕国;;结合依存关联分析和规则统计分析的情感词库构建方法[J];武汉大学学报(理学版);2013年05期
6 彭庆喜;钱铁云;;基于量化情感的网店垃圾评论检测[J];山东大学学报(理学版);2013年11期
7 黄俊;田生伟;禹龙;冯冠军;;基于维吾尔语情感词的句子情感分析[J];计算机工程;2012年09期
8 孙劲光;马志芳;孟祥福;;基于情感词属性和云模型的文本情感分类方法[J];计算机工程;2013年12期
9 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期
10 魏志生;吉阳生;罗春勇;陈家骏;;加入领域先验知识的产生式情感分类模型[J];计算机科学与探索;2011年12期
相关会议论文 前5条
1 陈奇哲;刘全升;姚天f ;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
3 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 王枞;涂序彦;刘嘉;;注意-情绪协调的个性化信息推荐模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
相关博士学位论文 前9条
1 刘全超;面向中文微博的观点挖掘与倾向性分析研究[D];北京理工大学;2015年
2 江腾蛟;基于句法和语义挖掘的Web金融评论情感分析[D];江西财经大学;2015年
3 杨亮;面向社交媒体的文本情感分析关键技术研究[D];大连理工大学;2016年
4 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年
5 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年
6 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年
7 施寒潇;细粒度情感分析研究[D];苏州大学;2013年
8 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
9 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年
相关硕士学位论文 前10条
1 王银;中文微博情感分析方法研究[D];广东技术师范学院;2015年
2 崔连超;互联网评论文本情感分析研究[D];山东大学;2015年
3 杜雪峰;藏文句子倾向性分析研究[D];中央民族大学;2015年
4 孙建超;微博舆情挖掘技术的研究与应用[D];电子科技大学;2015年
5 何天翔;基于情感词网的短文本情感分类方法研究[D];西南科技大学;2015年
6 丁星;基于文本倾向性分析技术的微博监控系统[D];江苏科技大学;2015年
7 李茜;博客意见检索关键问题研究[D];北京理工大学;2015年
8 李瑞静;汉语情感词模糊语义的量化分析及应用研究[D];北京理工大学;2015年
9 刘沙;电商网站的产品评价对象抽取研究[D];北京理工大学;2015年
10 佟铁;医患问答社区文本挖掘研究[D];辽宁科技大学;2015年
,本文编号:1598308
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1598308.html