中文微博情感词提取:N-Gram为特征的分类方法
本文关键词:中文微博情感词提取:N-Gram为特征的分类方法
更多相关文章: 情感词提取 中文微博 分类方法 N-Gram特征
【摘要】:情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法,如点互信息等,对中文微博数据中的新情感词发现是无效的。为此,设计一组基于上下文词汇的分类特征,即N-Gram特征,以刻画情感词的用词环境和用词模式,并以已知情感词为训练数据训练分类器,对候选情感词进行分类。实验结果表明,该方法较传统基于共现的方法要好。实验还发现,与英语不同的是,中文情感词通常会以名词词性出现,而基于共现的方法无法有效地区分该类情感词,这是造成其失效的主要原因,而该文提出的分类特征能解决这一问题。
【作者单位】: 江西财经大学信息管理学院;蒙特利尔大学计算机科学与运筹学系;华南理工大学计算机科学与工程学院;
【基金】:国家自然科学基金(61363039,61173146,61363010) 国家社会科学基金(12CTQ042)
【分类号】:TP391.1
【正文快照】: 2.蒙特利尔大学计算机科学与运筹学系,蒙特利尔加拿大H3C3J7;3.华南理工大学计算机科学与工程学院,广东广州510641)1引言文本情感倾向性分析是对信息发布者的态度(或称观点、情感)进行分析,广泛应用于舆情监督、产品评论分析等领域,近些年持续成为自然语言处理领域研究的热点
【相似文献】
中国期刊全文数据库 前10条
1 许璐蕾;;网络评论中情感词的获取及极性判断方法比较[J];电脑与电信;2011年01期
2 肖健;徐建;朱姝;万缨;许亮;;基于翻译和语义方法的情感词挖掘研究[J];计算机工程与应用;2011年32期
3 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期
4 代大明;李寿山;李培峰;朱巧明;;基于情绪词与情感词协作学习的情感分类方法研究[J];计算机科学;2012年12期
5 李勇敢;周学广;孙艳;张焕国;;结合依存关联分析和规则统计分析的情感词库构建方法[J];武汉大学学报(理学版);2013年05期
6 彭庆喜;钱铁云;;基于量化情感的网店垃圾评论检测[J];山东大学学报(理学版);2013年11期
7 杜嘉忠;徐健;刘颖;;网络商品评论的特征 情感词本体构建与情感分析方法研究[J];现代图书情报技术;2014年05期
8 张清亮;徐健;;网络情感词自动识别方法研究[J];现代图书情报技术;2011年10期
9 黄俊;田生伟;禹龙;冯冠军;;基于维吾尔语情感词的句子情感分析[J];计算机工程;2012年09期
10 孙劲光;马志芳;孟祥福;;基于情感词属性和云模型的文本情感分类方法[J];计算机工程;2013年12期
中国重要会议论文全文数据库 前5条
1 陈奇哲;刘全升;姚天f ;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
3 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 王枞;涂序彦;刘嘉;;注意-情绪协调的个性化信息推荐模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前8条
1 刘全超;面向中文微博的观点挖掘与倾向性分析研究[D];北京理工大学;2015年
2 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年
3 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
4 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年
5 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年
6 施寒潇;细粒度情感分析研究[D];苏州大学;2013年
7 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
8 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 孙博;关于情感词的意义用法[D];辽宁大学;2012年
2 王银;中文微博情感分析方法研究[D];广东技术师范学院;2015年
3 崔连超;互联网评论文本情感分析研究[D];山东大学;2015年
4 杜雪峰;藏文句子倾向性分析研究[D];中央民族大学;2015年
5 孙建超;微博舆情挖掘技术的研究与应用[D];电子科技大学;2015年
6 张圣声;基于微博平台的产品评论情感分类研究[D];广东外语外贸大学;2015年
7 何天翔;基于情感词网的短文本情感分类方法研究[D];西南科技大学;2015年
8 丁星;基于文本倾向性分析技术的微博监控系统[D];江苏科技大学;2015年
9 李茜;博客意见检索关键问题研究[D];北京理工大学;2015年
10 李瑞静;汉语情感词模糊语义的量化分析及应用研究[D];北京理工大学;2015年
,本文编号:1197194
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1197194.html