中文文本情感词典构建方法
本文关键词:中文文本情感词典构建方法
【摘要】:互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。
【作者单位】: 广东外语外贸大学思科信息学院;广东外语外贸大学国际工商管理学院;
【基金】:国家社会科学基金项目 教育部新世纪优秀人才支持计划 教育部人文社会科学研究青年基金项目 广东省科技计划项目 广东省社科规划项目 广东外语外贸大学校级项目 广东外语外贸大学研究生科研创新项目~~
【分类号】:TP391.1
【正文快照】: 1引言互联网上的海量文本情感挖掘,有利于产品推荐、观点抽取和舆情监控等研究。现有的文本情感分析方法,以基于机器学习方法的分类方法为主[1],典型的有朴素贝叶斯(na ve Bayes,NB)[2-3]、支持向量机(support vector machine,SVM)[4-5]和最大信息熵(maximum entropy,ME)[6]等
【参考文献】
中国期刊全文数据库 前5条
1 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期
2 常晓龙;张晖;;融合语素特征的中文褒贬词典构建[J];计算机应用;2012年07期
3 张剑峰;夏云庆;姚建民;;微博文本处理研究综述[J];中文信息学报;2012年04期
4 林江豪;阳爱民;周咏梅;陈锦;蔡泽键;;一种基于朴素贝叶斯的微博情感分类[J];计算机工程与科学;2012年09期
5 朱艳辉;栗春亮;徐叶强;柳位平;;一种基于多重词典的中文文本情感特征抽取方法[J];湖南工业大学学报;2011年02期
【共引文献】
中国期刊全文数据库 前10条
1 王银;吴新玲;;中文微博情感分析方法研究[J];广东技术师范学院学报;2014年03期
2 欧阳纯萍;阳小华;雷龙艳;徐强;余颖;刘志明;;多策略中文微博细粒度情绪分析研究[J];北京大学学报(自然科学版);2014年01期
3 饶洁;;基于内容的移动社交网络审计分析引擎[J];电脑知识与技术;2014年10期
4 杨霞;;基于同义词词林的微博客评论情感分类研究[J];电子科技;2014年07期
5 左荣欣;;一种分层多算法集成的微博情感分类方法[J];电子世界;2014年17期
6 金宇;朱洪波;王亚强;陈黎;于中华;;基于直推式学习的中文情感词极性判别[J];计算机工程与应用;2011年34期
7 丁建立;慈祥;黄剑雄;;网络评论倾向性分析[J];计算机应用;2010年11期
8 何凤英;;基于语义理解的中文博文倾向性分析[J];计算机应用;2011年08期
9 魏椺;向阳;陈千;;中文文本情感分析综述[J];计算机应用;2011年12期
10 杨鼎;阳爱民;;一种基于情感词典和朴素贝叶斯的中文文本情感分类方法[J];计算机应用研究;2010年10期
中国重要会议论文全文数据库 前1条
1 王明元;贾焰;周斌;黄九鸣;;一种基于主题相关性分类的微博话题立场研判方法[A];第29次全国计算机安全学术交流会论文集[C];2014年
中国博士学位论文全文数据库 前7条
1 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
2 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
3 施寒潇;细粒度情感分析研究[D];苏州大学;2013年
4 王宝勋;面向网络社区问答对的语义挖掘研究[D];哈尔滨工业大学;2013年
5 段亚娟;微博搜索的关键技术研究[D];中国科学技术大学;2014年
6 薛利;面向证券应用的WEB主题观点挖掘若干关键问题研究[D];复旦大学;2013年
7 董颖红;微博客社会情绪的测量及其与社会风险感知和风险决策的关系[D];南开大学;2014年
中国硕士学位论文全文数据库 前10条
1 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
2 白丽娟;基于文本挖掘的性别分类研究[D];哈尔滨工业大学;2011年
3 方明;基于Web的评论文本倾向性分析技术研究[D];山东师范大学;2012年
4 孙丽伟;基于在线评论的消费者非理性购买行为模糊推理研究[D];大连理工大学;2012年
5 张义;网络社区热点话题识别方法及其应用研究[D];合肥工业大学;2012年
6 刘玮楠;基于HNC理论的网购评论情感倾向性分析研究[D];大连理工大学;2013年
7 刘彦伟;微博话题追踪系统的研究与实现[D];北京交通大学;2013年
8 姚娜娜;基于机器学习的产品评论情感分类研究[D];首都师范大学;2013年
9 王静;突发事件网络舆情的情感倾向及演化分析[D];哈尔滨工业大学;2012年
10 陈其俊;基于在线评论的品牌关系型态模糊推理研究[D];大连理工大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 王鹏;樊兴华;;中文文本分类中利用依存关系的实验研究[J];计算机工程与应用;2010年03期
2 彭京;杨冬青;唐世渭;付艳;蒋汉奎;;一种基于语义内积空间模型的文本聚类算法[J];计算机学报;2007年08期
3 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期
4 焦庆争;蔚承建;;一种可靠信任推荐文本分类特征权重算法[J];计算机应用研究;2010年02期
5 杨鼎;阳爱民;;一种基于情感词典和朴素贝叶斯的中文文本情感分类方法[J];计算机应用研究;2010年10期
6 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
7 黄永光;刘挺;车万翔;胡晓光;;面向变异短文本的快速聚类算法[J];中文信息学报;2007年02期
8 彭泽映;俞晓明;许洪波;刘春阳;;大规模短文本的不完全聚类[J];中文信息学报;2011年01期
9 谢丽星;周明;孙茂松;;基于层次结构的多策略中文微博情感分析和特征抽取[J];中文信息学报;2012年01期
10 赵妍妍;秦兵;车万翔;刘挺;;基于句法路径的情感评价单元识别[J];软件学报;2011年05期
中国博士学位论文全文数据库 前3条
1 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
2 龚才春;短文本语言计算的关键技术研究[D];中国科学院研究生院(计算技术研究所);2008年
3 杜伟夫;文本倾向性分析中的情感词典构建技术研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前1条
1 吴薇;大规模短文本的分类过滤方法研究[D];北京邮电大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 许璐蕾;;网络评论中情感词的获取及极性判断方法比较[J];电脑与电信;2011年01期
2 肖健;徐建;朱姝;万缨;许亮;;基于翻译和语义方法的情感词挖掘研究[J];计算机工程与应用;2011年32期
3 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期
4 代大明;李寿山;李培峰;朱巧明;;基于情绪词与情感词协作学习的情感分类方法研究[J];计算机科学;2012年12期
5 李勇敢;周学广;孙艳;张焕国;;结合依存关联分析和规则统计分析的情感词库构建方法[J];武汉大学学报(理学版);2013年05期
6 彭庆喜;钱铁云;;基于量化情感的网店垃圾评论检测[J];山东大学学报(理学版);2013年11期
7 杜嘉忠;徐健;刘颖;;网络商品评论的特征 情感词本体构建与情感分析方法研究[J];现代图书情报技术;2014年05期
8 张清亮;徐健;;网络情感词自动识别方法研究[J];现代图书情报技术;2011年10期
9 黄俊;田生伟;禹龙;冯冠军;;基于维吾尔语情感词的句子情感分析[J];计算机工程;2012年09期
10 孙劲光;马志芳;孟祥福;;基于情感词属性和云模型的文本情感分类方法[J];计算机工程;2013年12期
中国重要会议论文全文数据库 前5条
1 陈奇哲;刘全升;姚天f ;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
3 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 王枞;涂序彦;刘嘉;;注意-情绪协调的个性化信息推荐模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前7条
1 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年
2 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
3 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年
4 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年
5 施寒潇;细粒度情感分析研究[D];苏州大学;2013年
6 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
7 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 孙博;关于情感词的意义用法[D];辽宁大学;2012年
2 张玉杰;情感词的倾向性研究[D];北京邮电大学;2011年
3 周晓;基于互联网的情感词库扩展与优化研究[D];东北大学;2011年
4 任望;基于股价的情感词库获取[D];西南财经大学;2014年
5 赵文婧;产品描述词及情感词抽取模式的研究[D];北京邮电大学;2010年
6 罗艳;基于情感词的产品评论挖掘研究[D];华中科技大学;2010年
7 喻琦;中文微博情感分析技术研究[D];浙江工商大学;2013年
8 刘邵博;社会网络新媒体的信息获取与情感分类关键技术研究及实现[D];河北科技大学;2013年
9 时迎超;面向网络的用户观点评价报告的自动生成研究[D];东北大学;2011年
10 陈硕;基于词性与句法的产品评论特征及情感词挖掘[D];河北大学;2012年
,本文编号:1231431
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1231431.html