当前位置:主页 > 科技论文 > 自动化论文 >

基于分类的微博新情感词抽取方法和特征分析

发布时间:2019-07-02 10:46
【摘要】:情感或情绪分析在舆情分析、商品评论分析、商品推荐等领域应用广泛,而文本中的情感或情绪分析通常以情感词典为基础.人工情感词典虽然准确但构建代价大、难以及时更新,很难适应微博这类新情感词快速更迭的数据.微博平台为新情感词的发布和传播提供了便捷的途径,是新情感词的重要来源.考虑到已有规模较大的人工情感词典及大量包含新情感词的微博数据,在统计、分析、对比中、英两种语言微博中情感词分布差异的基础上,提出了与特定语言无关的基于分类思想的微博新情感词抽取方法cNSEm.cNSEm根据微博数据集和情感词典自动构建训练数据、训练分类器并判别候选词的情感极性,最后采用投票机制确定候选词的情感极性.通过大量而细致的实验,分析了cNSEm在中、英文两种语言的微博数据上的表现、六类特征的作用和用法以及抽取的新情感词对微博情感分类任务的帮助作用.实验结果表明,cNSEm比经典的基于共现和极性传播的方法要好,特别是当考虑中文微博数据集中的名词类情感词时.对cNSEm抽取的新情感词进行了直接和间接两种方法评测,前者利用人工情感词典作参照,后者考察抽取的新情感词对情感分类的帮助作用,从评测指标上看,cNSEm抽取的新情感词与人工情感词典的质量相当,并且cNSEm能适应有较大差异的中、英两个语种.
[Abstract]:Emotional or emotional analysis is widely used in public opinion analysis, commodity review analysis, commodity recommendation and other fields, while emotional or emotional analysis in texts is usually based on emotional dictionaries. Although the artificial emotion dictionary is accurate, it is expensive to build, it is difficult to update it in time, and it is difficult to adapt to the rapid change of new emotional words such as Weibo. Weibo platform provides a convenient way for the release and dissemination of new emotional words, and is an important source of new emotional words. Considering the existing large-scale artificial emotion dictionaries and a large number of Weibo data containing new emotional words, on the basis of statistics, analysis and comparison of the distribution differences of emotional words in Weibo between English and English, a new emotional word extraction method based on classification idea, cNSEm.cNSEm, which is independent of specific language, is proposed to automatically construct training data, train classifiers and distinguish the emotional polarity of candidate words according to Weibo dataset and emotion dictionary. Finally, the emotional polarity of candidate words is determined by voting mechanism. Through a large number of detailed experiments, this paper analyzes the performance of cNSEm on Weibo data in Chinese and English, the function and usage of six kinds of features, and the help of extracted new emotional words to Weibo emotion classification task. The experimental results show that cNSEm is better than the classical method based on co-occurrence and polar propagation, especially when considering the noun emotional words in the Chinese Weibo dataset. The new emotional words extracted by cNSEm are evaluated directly and indirectly. The former uses artificial emotion dictionary as a reference, while the latter examines the helpful effect of the extracted new emotional words on emotion classification. From the evaluation index, the quality of the new emotional words extracted by cNSEm is the same as that of artificial emotion dictionaries, and cNSEm can adapt to Chinese and English languages where there are great differences.
【作者单位】: 江西财经大学信息管理学院 蒙特利尔大学计算机科学与运筹学系
【基金】:国家自然科学基金(61762042,61363039,61562032) 江西省落地计划项目(KJLD14035) 江西省自然科学基金(20171BAB202021,20152ACB20003)资助~~
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 韩彤晖;杨东强;马宏伟;单词统计特性在情感词自动抽取和商品评论分类中的作用[J];计算机应用研究;2019年03期

2 刘德喜;聂建云;万常选;刘喜平;廖述梅;廖国琼;钟敏娟;江腾蛟;;基于分类的微博新情感词抽取方法和特征分析[J];计算机学报;2018年07期

3 江腾蛟;万常选;刘德喜;刘喜平;廖国琼;;基于语义分析的评价对象-情感词对抽取[J];计算机学报;2017年03期

4 郭丹丹;金雅声;丁燕兵;德格吉呼;;情感词信息加工的脑神经认知机制研究[J];西北民族大学学报(自然科学版);2015年03期

5 吴金源;冀俊忠;赵学武;吴晨生;杜芳华;;基于特征选择技术的情感词权重计算[J];北京工业大学学报;2016年01期

6 刘德喜;;情感词扩展对微博情感分类性能影响的实验分析[J];小型微型计算机系统;2016年05期

7 何天翔;张晖;李波;杨春明;赵旭剑;;结合情感词网的中文短文本情感分类[J];计算机应用研究;2015年10期

8 孙艳;周学广;付伟;;基于依存关联分析的情感词扩展[J];北京邮电大学学报;2012年05期

9 邓淑卿;李玩伟;徐健;;基于句法依赖规则和词性特征的情感词识别研究[J];情报理论与实践;2018年05期

10 陈鑫;王素格;廖健;;基于词语相关度的微博新情感词自动识别[J];计算机应用;2016年02期

相关会议论文 前6条

1 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年

2 陈奇哲;刘全升;姚天f ;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年

3 刘鸿宇;赵妍妍;秦兵;刘挺;;评价对象抽取及其倾向性分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

4 葛正荣;李婷玉;姚天f ;;汉语情感问题类型分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年

5 张军;于浩;内野宽治;;UGC中产品评论信息的挖掘[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

6 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

相关博士学位论文 前10条

1 江腾蛟;基于句法和语义挖掘的Web金融评论情感分析[D];江西财经大学;2015年

2 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年

3 彭云;提取商品特征和情感词的语义约束LDA模型研究[D];江西财经大学;2016年

4 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年

5 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年

6 李岩;文本情感分析中关键问题的研究[D];北京邮电大学;2014年

7 刘全超;面向中文微博的观点挖掘与倾向性分析研究[D];北京理工大学;2015年

8 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年

9 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年

10 谢松县;社交媒体中观点信息分析与应用[D];国防科学技术大学;2014年

相关硕士学位论文 前10条

1 冯佳;基于半监督学习的餐厅评论情感分析技术[D];华中科技大学;2016年

2 易剑波;基于文本挖掘的电商用户评论分析与系统实现[D];东南大学;2017年

3 孙健;基于信息融合的情感词典扩建研究[D];东华大学;2017年

4 焦晨晨;基于深度学习的情感词向量生成模型研究[D];北京邮电大学;2016年

5 周晓;基于互联网的情感词库扩展与优化研究[D];东北大学;2011年

6 何新宇;基于改进情感词识别方法的舆情情感分析系统设计[D];北方工业大学;2016年

7 张玉杰;情感词的倾向性研究[D];北京邮电大学;2011年

8 陈鑫;基于语义相关度特定文体新情感词自动识别[D];山西大学;2016年

9 罗艳;基于情感词的产品评论挖掘研究[D];华中科技大学;2010年

10 冯仓龙;商品细粒度评价的识别与分析[D];沈阳航空航天大学;2017年



本文编号:2508873

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2508873.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e1282***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com