基于多特征的微博情感分析研究
本文选题:微博 切入点:情感词 出处:《计算机工程》2017年12期 论文类型:期刊论文
【摘要】:为提高微博情感分类识别的正确率,以网络微博数据作为研究对象,提出一种基于图的情感基准词选择方法。结合知网相似度知识,构建图模型,以图中节点中介性的值为依据,选择出高质量和高覆盖率的情感基准词。根据得到的基准词构建情感分析中所需的情感词典,并给出情感词极性。同时将情感词应用于挖掘短句情感特征,加入到传统支持向量机(SVM)模型中,对微博句子挖掘更多的语义信息从而获取更合理的语义合成函数,捕捉句子情感变化以更好地把握微博整句情感。采用具有特征约束特性的条件随机场(CRF)模型对短句进行分类。实验结果验证了CRF模型短句分类的有效性,与多种特征的SVM分类方法相比,在不同数据集上具有更好的分类效果。
[Abstract]:In order to improve the correct rate of Weibo's emotion classification and recognition, a graph-based affective benchmark word selection method is proposed, which is based on the online Weibo data, and the graph model is constructed by combining the knowledge of the knowledge of knowledge and network similarity. Based on the intermediate values of the nodes in the map, the emotional reference words with high quality and high coverage are selected. The emotion dictionary needed in the emotional analysis is constructed according to the obtained reference words. The polarity of affective words is also given. At the same time, affective words are applied to mining the affective features of short sentences and are added to the traditional support vector machine (SVM) model to mine more semantic information for Weibo sentences in order to obtain more reasonable semantic composition functions. In order to grasp Weibo's whole sentence emotion better, we use the conditional random field (CRF) model with characteristic constraints to classify short sentences. The experimental results show that the CRF model is effective in short sentence categorization. Compared with the SVM classification method with various features, it has better classification effect on different data sets.
【作者单位】: 武汉大学计算机学院;武汉大学软件工程国家重点实验室;
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 杨凌霄;武建平;;机器学习方法在人脸检测中的应用[J];计算机与数字工程;2008年03期
2 ;第十届中国机器学习会议征文通知2006年10月13~15日,海口[J];计算机研究与发展;2005年10期
3 邵平;;机器学习与人脸识别方法概述[J];玉林师范学院学报;2006年03期
4 ;第12届中国机器学习会议征文通知 2010年8月6—8日 济南[J];计算机研究与发展;2009年11期
5 ;第12届中国机器学习会议征文通知[J];计算机研究与发展;2009年12期
6 ;第12届中国机器学习会议征文通知 2010年8月6-8日 济南[J];计算机研究与发展;2010年01期
7 柏宏权;韩庆年;;机器学习在适应性教学系统中的应用研究[J];南京师范大学学报(工程技术版);2007年04期
8 吴肖炎;郭瑞;;基于机器学习的计算机安全技术综述(上)[J];保密科学技术;2013年03期
9 杨升;常胜;侯丽;;机器学习在计算机免疫中的应用[J];微计算机信息;2007年30期
10 ;《软件学报》统计学习研究与应用专刊征文通知[J];软件学报;2012年11期
相关会议论文 前4条
1 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
2 周军;何力;韩伟红;邓璐;;基于机器学习的中文评论倾向性分类实证研究[A];第28次全国计算机安全学术交流会论文集[C];2013年
3 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 陈振兴;贲可荣;;机器学习在软件预测与评估中的应用[A];2006年全国理论计算机科学学术年会论文集[C];2006年
相关重要报纸文章 前3条
1 百度公司技术副总监 多媒体部负责人 余凯;深度学习与多媒体搜索技术演进[N];中国信息化周报;2013年
2 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
3 本报记者 张晔邋通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
相关博士学位论文 前8条
1 杜宇;基于深度机器学习的体态与手势感知计算关键技术研究[D];浙江大学;2017年
2 刘章林;基于机器学习的编译优化适应性研究[D];中国科学院研究生院(计算技术研究所);2006年
3 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
4 王秉卿;基于机器学习的查询优化研究[D];复旦大学;2012年
5 刘全超;面向中文微博的观点挖掘与倾向性分析研究[D];北京理工大学;2015年
6 江腾蛟;基于句法和语义挖掘的Web金融评论情感分析[D];江西财经大学;2015年
7 杨亮;面向社交媒体的文本情感分析关键技术研究[D];大连理工大学;2016年
8 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年
相关硕士学位论文 前10条
1 陈国兰;基于突发词和情感分析的微博突发事件监测研究[D];南京邮电大学;2015年
2 陈鹏;基于深度语义特征的情感分析研究[D];哈尔滨工业大学;2016年
3 唐明霜;基于翻译模型的网络评论情感分析研究[D];电子科技大学;2016年
4 张春艳;电商网站中面料商品的情感自动分类研究[D];北京服装学院;2017年
5 赵一昕;基于情感分析的公交舆情分析系统研发及应用[D];浙江大学;2017年
6 刘燕辉;基于主题模型的无监督情感分类研究[D];吉林大学;2015年
7 毛海斌;基于半监督机器学习的情感分类领域适应问题研究[D];南京理工大学;2015年
8 王成;基于半监督机器学习的文本情感分析技术[D];南京理工大学;2015年
9 孙科;基于Spark的机器学习应用框架研究与实现[D];上海交通大学;2015年
10 刘江龙;基于机器学习的射频指纹定位方法研究[D];电子科技大学;2015年
,本文编号:1636905
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1636905.html