基于极性词典的中文微博客情感分类
本文关键词:基于极性词典的中文微博客情感分类
【摘要】:微博客是近年来自然语言处理领域研究的热点。主要针对中文微博客中的情感分类展开研究。结合网络新词和基础情感词,同时考虑了情感词的极性情感强弱,构建四个词典,分别是基础情感词典、表情符号词典、否定词词典和双重否定词词典;在情感词典的基础上,融合汉语语言学特征和微博情感表达特征,提出一种新的基于极性词典的情感分类方法。实验准确率达到82.2%。实验结果表明,提出的方法可以对中文微博进行较好的情感分类,有一定的应用价值。
【作者单位】: 北京信息科技大学网络文化与数字传播北京市重点实验室;新华网络股份有限公司;
【关键词】: 微博客 情感分类 词典 语言学特征
【基金】:国家自然科学基金项目(61271304) 国家科技支撑计划课题(2011BAH11B03) 北京市教委科技发展计划项目(KM201211232023)
【分类号】:TP391.1;TP393.092
【正文快照】: 0引言互联网的兴起,特别是Web2.0时代的到来,使网民不再只是互联网的“消费者”,也成为了互联网的“生产者”。随着Web应用的增多,用户产生内容也呈爆炸式的增长,人们越来越多的在论坛、BBS、博客和微博等应用上表达自己的情感。其中,微博作为新生代应用的佼佼者,在近几年来取
【参考文献】
中国期刊全文数据库 前7条
1 刘志明;刘鲁;;基于机器学习的中文微博情感分类实证研究[J];计算机工程与应用;2012年01期
2 陆文星;王燕飞;;中文文本情感分析研究综述[J];计算机应用研究;2012年06期
3 徐军;丁宇新;王晓龙;;使用机器学习方法进行新闻的情感自动分类[J];中文信息学报;2007年06期
4 李寿山;黄居仁;;基于Stacking组合分类方法的中文情感分类研究[J];中文信息学报;2010年05期
5 谢丽星;周明;孙茂松;;基于层次结构的多策略中文微博情感分析和特征抽取[J];中文信息学报;2012年01期
6 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
7 张成功;刘培玉;朱振方;方明;;一种基于极性词典的情感分析方法[J];山东大学学报(理学版);2012年03期
【共引文献】
中国期刊全文数据库 前10条
1 潘文富;郭友实;;网络舆情监测技术研究综述[J];福建电脑;2011年08期
2 来亮;钱屹;;文本情感分析综述[J];计算机光盘软件与应用;2012年18期
3 孙建旺;吕学强;郭嵡秀;;基于微博转发集的微博过滤研究[J];北京信息科技大学学报(自然科学版);2013年03期
4 许星;席鹏富;秦天;;社会网络的舆情信息分析与可视化——以新浪微博为例[J];计算机光盘软件与应用;2013年12期
5 吴维;肖诗斌;;基于多特征与复合分类法的中文微博情感分析[J];北京信息科技大学学报(自然科学版);2013年04期
6 李爱清;何烁;郗亚辉;;产品评论挖掘可视化实验平台的开发[J];河北大学学报(自然科学版);2012年02期
7 吴琼;谭松波;许洪波;段m#毅;程学旗;;基于随机游走模型的跨领域倾向性分析研究[J];计算机研究与发展;2010年12期
8 王素格;李德玉;魏英杰;;基于赋权粗糙隶属度的文本情感分类方法[J];计算机研究与发展;2011年05期
9 白鸽;左万利;赵乾坤;曲仁镜;;使用机器学习对汉语评论进行情感分类[J];吉林大学学报(理学版);2009年06期
10 李培;何中市;黄永文;;基于依存关系分析的网络评论极性分类研究[J];计算机工程与应用;2010年11期
中国重要会议论文全文数据库 前5条
1 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 王克;张春良;高晓兴;朱靖波;;基于三类训练两类判别框架的主客观性句子识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 曾青青;杨尔弘;;突发事件文本的信息结构分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 周军;何力;韩伟红;邓璐;;基于机器学习的中文评论倾向性分类实证研究[A];第28次全国计算机安全学术交流会论文集[C];2013年
5 朱浩然;梁循;马跃峰;纪阳;李启东;马超;;金融领域中文微博情感分析[A];第八届(2013)中国管理学年会论文集(选编)[C];2013年
中国博士学位论文全文数据库 前10条
1 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
2 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
3 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
4 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
5 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年
6 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
7 胡明涵;面向领域的文本分类与挖掘关键技术研究[D];东北大学 ;2009年
8 杜伟夫;文本倾向性分析中的情感词典构建技术研究[D];哈尔滨工业大学;2010年
9 田野;基于微博平台的事件趋势分析及预测研究[D];武汉大学;2012年
10 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 邓忠莹;中文文本倾向性分类系统研究[D];昆明理工大学;2009年
3 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
4 杨玉珍;基于统计与规则的特征权重计算方法研究与应用[D];山东师范大学;2011年
5 吴秀梅;基于潜在语义分析和最大熵的中文情感分析研究[D];北京交通大学;2011年
6 徐淑坦;基于改进RBF神经网络的文本情感分类研究[D];吉林大学;2011年
7 周利娟;基于情感语义相似度的音乐检索模型研究[D];大连理工大学;2011年
8 张博;基于SVM的中文观点句抽取[D];北京邮电大学;2011年
9 张浩;多粒度下的多分类情感分析研究[D];北京邮电大学;2011年
10 史丽君;基于特征强化的中文产品评价挖掘研究[D];合肥工业大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 单松巍,冯是聪,李晓明;几种典型特征选取方法在中文网页分类上的效果比较[J];计算机工程与应用;2003年22期
2 李钝;曹付元;曹元大;万月亮;;基于短语模式的文本情感分类研究[J];计算机科学;2008年04期
3 周立柱;贺宇凯;王建勇;;情感分析研究综述[J];计算机应用;2008年11期
4 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
5 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
6 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[J];中文信息学报;2007年01期
7 王根;赵军;;基于多重冗余标记CRFs的句子情感分析研究[J];中文信息学报;2007年05期
8 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
9 徐军;丁宇新;王晓龙;;使用机器学习方法进行新闻的情感自动分类[J];中文信息学报;2007年06期
10 徐琳宏;林鸿飞;赵晶;;情感语料库的构建和分析[J];中文信息学报;2008年01期
中国博士学位论文全文数据库 前1条
1 尹洪波;否定词与副词共现的句法语义研究[D];中国社会科学院研究生院;2008年
中国硕士学位论文全文数据库 前5条
1 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
2 郝雷红;现代汉语否定副词研究[D];首都师范大学;2003年
3 杨勇涛;WEB舆情观点挖掘关键技术研究[D];电子科技大学;2009年
4 朱力;中文词语情感倾向研究[D];哈尔滨工业大学;2009年
5 谭俊武;面向网络舆情分析的文本倾向性分类技术的研究与实现[D];国防科学技术大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 祝启波;一部专业技术双语词典的计算机转换及其结果分析[J];辞书研究;1997年05期
2 林浩;韩冰;杨乐华;;一种基于改进最大匹配快速中文分词算法[J];科技创新导报;2009年09期
3 菠萝王;;带你体验有道词典3.4正式版[J];电脑知识与技术(经验技巧);2010年12期
4 施建军;机器单词词典和日语单词的自动切分[J];外语电化教学;1994年04期
5 王峰;给您的电脑配本好词典[J];市场与电脑;1997年11期
6 孙巍;;一种面向中文信息检索的汉语自动分词方法[J];现代图书情报技术;2006年07期
7 沉迷的石头;;扩展有道词典取词翻译功能[J];电脑迷;2009年21期
8 黄德根;刘小华;李丽双;;汉英机器翻译中趋向动词处理研究[J];大连理工大学学报;2006年05期
9 刘志杰,刘倬;英汉机器翻译系统中基本词典与专业词典的关系[J];语言文字应用;1997年03期
10 赖翔飞,吴利夫;TRS-80MMS FORTH系统结构介绍[J];小型微型计算机系统;1983年05期
中国重要会议论文全文数据库 前10条
1 曾华琳;李堂秋;曹冬林;;机器辅助翻译系统用词典的管理[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 德·萨日娜;那顺乌日图;;《蒙古语语义信息词典》的初步构建[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 罗娜;左万利;袁福宇;张靖波;张慧杰;;使用本体语义提高文本聚类(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
4 张紫琼;李一军;叶强;;汉语商品评论情感分析——一种基于搜索引擎的无监督方法(英文)[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 左维松;昝红英;张坤丽;吴云芳;;规则和统计相结合的情感分析研究[A];第五届全国信息检索学术会议论文集[C];2009年
6 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
7 赵世奇;刘挺;李生;;一种基于主题的文本聚类方法[A];第三届学生计算语言学研讨会论文集[C];2006年
8 贾玉祥;俞士汶;;基于词典的名词性隐喻识别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 李江波;周强;陈祖舜;;汉语词典快速查询算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 范力;有道推出桌面词典企业版[N];科技日报;2009年
2 本报记者 李响;丁磊:全力打造中文搜索引擎[N];计算机世界;2008年
3 本报记者 廖剑锋;词典软件告别盒装 用户尽享免费翻译服务[N];通信信息报;2011年
4 宁海伟;名人CE开启崭新的windows学英语时代[N];中国电脑教育报;2006年
5 余海玲 本报记者 马里;金山词霸用十年典藏版贺岁[N];大众科技报;2006年
6 中科院计算技术研究所 吕雅娟邋付雷 黄瑾 何中军 刘群;化繁为简的统计机器翻译技术[N];中国计算机报;2007年
7 ;原版VS Remux[N];中国电脑教育报;2008年
8 俞士汶;语言信息处理的基石[N];计算机世界;2007年
9 记者 王坤宁;商务印书馆信息化建设迈出新步伐[N];中国新闻出版报;2006年
10 沈建苗邋编译;IE插件各显神通[N];计算机世界;2008年
中国博士学位论文全文数据库 前9条
1 刘健;基于近似文本分析的意见挖掘[D];上海大学;2007年
2 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
3 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年
4 杜伟夫;文本倾向性分析中的情感词典构建技术研究[D];哈尔滨工业大学;2010年
5 赵琼;基于视频和三维动作捕捉数据的人体动作识别方法的研究[D];中国科学技术大学;2013年
6 龙腾;旋转方向无关的无约束手写中文词组识别[D];华南理工大学;2008年
7 余振山;自然语言文本中数字水印的设计与研究[D];中国科学技术大学;2009年
8 唐振军;感知图像Hash框架、方法及性能测评指标[D];上海大学;2010年
9 范冬梅;基于统计学习的词义识别方法研究[D];哈尔滨工程大学;2011年
中国硕士学位论文全文数据库 前10条
1 段恩泽;基于统计的汉语自动分词系统[D];电子科技大学;2005年
2 马月珠;基于短语模式的评论性文章情感抽取方法研究[D];北京邮电大学;2009年
3 曲晓航;统计与语言学相结合的词对齐及相关融合策略研究[D];哈尔滨工业大学;2008年
4 刘春辉;基于优化最大匹配的中文分词方法研究[D];燕山大学;2009年
5 赵晓南;字符串理论研究与应用探讨[D];吉林大学;2008年
6 罗准辰;关键词抽取的研究与实现[D];国防科学技术大学;2008年
7 张永臣;基于互联网文本数据的特定领域双语词典抽取[D];中国科学院研究生院(软件研究所);2005年
8 卿太杰;基于动态词典的文本压缩研究[D];北京邮电大学;2006年
9 来火尧;基于主题相关性的中文文本情感分类研究[D];上海交通大学;2009年
10 郑文英;旅行目的地中文评论的情感分析研究[D];哈尔滨工业大学;2010年
,本文编号:646248
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/646248.html