用于微博情感分析的一种情感语义增强的深度学习模型
本文关键词: 微博 情感分析 深度学习 卷积神经网络 自然语言处理 社交网络 出处:《计算机学报》2017年04期 论文类型:期刊论文
【摘要】:基于神经语言模型的词向量表示技术能够从大规模的未标注文本数据集中自动学习词语的有效特征表示,已经在许多自然语言处理任务及研究中取得重要进展.微博中的表情符号是微博情感分析最重要的特征之一,已有大量的研究工作在探索有效地利用表情符号来提升微博情感分类效果.借助词向量表示技术,为常用表情符号构建情感空间的特征表示矩阵R~E;基于向量的语义合成计算原理,通过矩阵R~E与词向量的乘积运算完成词义到情感空间的映射;接着输入到一个MCNN(Multi-channel Convolution Neural Network)模型,学习一个微博的情感分类器.整个模型称为EMCNN(Emotion-semantics enhanced MCNN),将基于表情符号的情感空间映射与深度学习模型MCNN结合,有效增强了MCNN捕捉情感语义的能力.EMCNN模型在NLPCC微博情感评测数据集上的多个情感分类实验中取得最佳分类性能,并在所有性能指标上超过目前已知文献中的最好分类效果.在取得以上分类性能提升的同时,EMCNN相对MCNN的训练耗时在主客观分类时减少了36.15%,在情感7分类时减少了33.82%.
[Abstract]:Word vector representation technology based on neural language model can automatically learn effective feature representation of words from large scale unlabeled text dataset. Important progress has been made in many natural language processing tasks and studies. The emoji in Weibo is one of the most important features of Weibo's affective analysis. A great deal of research has been done to explore the effective use of emoji to improve Weibo's affective classification. The feature representation matrix of affective space is constructed for common emoji. Based on the computation principle of semantic synthesis of vector, the mapping of word meaning to emotion space is completed by multiplying the product of matrix Rae and word vector, and then an MCNN(Multi-channel Convolution Neural network model is inputted. Learn a Weibo's affective classifier. The whole model, called EMCNN(Emotion-semantics enhanced MCNNN, combines emoji based affective space mapping with depth learning model MCNN. It effectively enhances the ability of MCNN to capture emotional semantics. EMCNN model achieves the best classification performance in a number of affective classification experiments on the emotional evaluation dataset of NLPCC Weibo. At the same time, the training time of MCNN relative to MCNN is reduced by 36.15 in subjective and objective classification, and 33.82 in emotional 7 classification.
【作者单位】: 武汉大学计算机学院;武汉大学软件工程国家重点实验室;
【基金】:国家自然科学基金(61303115,61373039,61472290) 高等学校博士学科点专项科研基金(2013014111002512)资助~~
【分类号】:TP391.1;TP18
【相似文献】
相关期刊论文 前10条
1 ;《统计自然语言处理基础》[J];中文信息学报;2005年03期
2 徐继伟;;自然语言处理技术在生物信息学中的应用(英文)[J];生物信息学;2006年01期
3 王挺;麦范金;刘忠;;自然语言处理及其应用前景的研究[J];桂林航天工业高等专科学校学报;2006年04期
4 ;第二届全国少数民族青年自然语言处理学术研讨会召开[J];模式识别与人工智能;2008年05期
5 高精揓;萧国政;姬东鸿;;手持嵌入式系统应用中的自然语言处理关键技术[J];长江学术;2009年02期
6 冯志伟;;自然语言处理中的一些宏观问题之我见[J];中国外语;2009年05期
7 曹佩;;论自然语言处理[J];信息与电脑(理论版);2010年05期
8 邵泽国;;语言科学发展的新分支——自然语言处理[J];电子科技;2013年05期
9 李霞;;面向本科阶段开设的“自然语言处理”课程教学研究[J];福建电脑;2013年07期
10 贺广明;;自然语言处理的六个级别[J];情报杂志;1988年04期
相关会议论文 前10条
1 马颖华;苏贵洋;;基于概念的自然语言处理[A];第一届学生计算语言学研讨会论文集[C];2002年
2 李生;;哈工大自然语言处理研究进展[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 ;哈尔滨工业大学智能技术与自然语言处理研究室简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
4 冯志伟;;自然语言处理中的理性主义和经验主义[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 李文;程华良;彭耀;温明杰;肖威清;张陈斌;陈宗海;;自然语言处理云平台[A];系统仿真技术及其应用学术论文集(第15卷)[C];2014年
7 徐超;毕玉德;;面向自然语言处理的韩国语隐喻知识库构建研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 ;SWCL-2006组织机构[A];第三届学生计算语言学研讨会论文集[C];2006年
10 张sソ,
本文编号:1496166
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1496166.html