中文微影评文本情感倾向性识别技术研究
发布时间:2017-11-28 10:05
本文关键词:中文微影评文本情感倾向性识别技术研究
更多相关文章: 情感识别 中文微影评 Ens-PRM 集成学习
【摘要】:互联网的发展和普及改变着人们的生活方式和情感表达方式,越来越多的人特别是青少年习惯于通过微博、论坛、社区等网络载体表达自己的主观情感,如喜欢、厌恶、高兴、悲伤等等。在网络中,包含主观情感态度的文本数据巨大,且快速增长,大量具有潜在经济价值或社会价值的信息包含于这些文本中,例如分析产品评论,可以帮助商家改进产品,拓宽销路,增加经济效益;政府通过分析大众对某一政策的评论可以了解民声,更好地为人民服务。因此,高效的文本情感倾向性识别技术具有很强的实用价值。 本文研究的最终目的是希望将文本情感倾向性识别技术应用于教师教学评价中,实现计算机与教育两个领域的结合,由于网络中缺少专门评价教师教学技能、教学态度、教学效果的网站,或者即使有,数据量也不够大。因而难以收集关于教师评价方面的数据集。有鉴于此,本文以微影评为研究对象,研究微影评情感倾向性识别算法,并以教学视频评论的情感倾向性识别作为示范应用。 本文首先分析了国内外文本情感倾向性的研究现状,在微影评数据收集阶段,采用针对特定影评网站设计的微影评自动爬取程序,高效准确地爬取微影评并保存为后续实验所需的数据结构和格式。微影评文本是短文本类型,文本特征稀疏且具有鉴别力的信息容易在特征提取时遗失,因此在文本特征提取与选择阶段运用N-gram和主成分分析(PCA)技术。然后本文呈现了基于集成概率推理模型(Ens-PRM)的情感倾向性识别算法,该算法集合了PCA、随机特征子空间划分以及概率推理模型几个元素,将多个弱分类器集成为一个分类性能较强的分类器。本文基于微影评数据集,采用简单的基于词典的算法、多项式贝叶斯算法和Ens-PRM进行二值分类,实验结果表明Ens-PRM的分类性能比较理想。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.1;G434
【参考文献】
中国期刊全文数据库 前8条
1 邓汉成,王敏芳,王瑛;查全率与查准率之间关系的理论研究[J];情报学报;2000年04期
2 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
3 罗海飞;吴刚;杨金生;;基于贝叶斯的文本分类方法[J];计算机工程与设计;2006年24期
4 于成龙;;基于PCA的特征选择算法[J];计算机技术与发展;2011年04期
5 周文霞;;现代文本分类技术研究[J];武警学院学报;2007年12期
6 马海兵;刘永丹;王兰成;李荣陆;;三种文档语义倾向性识别方法的分析与比较[J];现代图书情报技术;2007年04期
7 王春峰,万海晖,张维;基于神经网络技术的商业银行信用风险评估[J];系统工程理论与实践;1999年09期
8 孙丽华,张积东,李静梅;一种改进的kNN方法及其在文本分类中的应用[J];应用科技;2002年02期
中国硕士学位论文全文数据库 前1条
1 郑伟;文本分类特征选取技术研究[D];内蒙古大学;2008年
,本文编号:1233567
本文链接:https://www.wllwen.com/jiaoyulunwen/wangluojiaoyulunwen/1233567.html