中文微博细粒度情感判别研究
本文关键词:中文微博细粒度情感判别研究
【摘要】:微博作为一种新型的社交网络平台,能随时随地发布简短且内容丰富的文本,这些信息有可能代表用户的观点或喜好,挖掘用户这些信息对舆情监控、市场营销、谣言控制等都有重要意义。目前,对文本的情感分析侧重于简单的积极、消极二值分类。由于微博文本存在口语化严重,数据稀疏等问题,因此对情感深层次的细粒度判别是十分重要且必要的。本文工作包括以下两个方面:(1)针对有明显情感词的微博,设计了一种基于情感元素模型的微博细粒度情感判别方法。根据依存句法,分析出句子中词语间的依存关系,找出副词、否定词等词语级情感影响因子,建立情感元素模型并计算分值,对每种粒度分别进行求和,将最大值所对应的细粒度作为微博的情感的策略。(2)针对无明显情感词的微博,设计了一种多特征支持向量机的微博细粒度情感判别的方法。首先,在特征选择阶段进行改进,针对传统卡方检验(CHI)特征选择不稳定性,只考虑微博条数而未考虑词频,提出一种卡方检验-词频逆文档词频(CHI-TFIDF)的特征抽取方法,将词频、逆文档词频引入到CHI算法中。实验表明改进的CHI算法相比传统CHI稳定性和有效性均有所提高。将上述得到的特征词再结合微博句子结构和语义等特征引入到支持向量机算法中,训练模型最终得到细粒度判别结果。将本文提出的方法与传统的机器学习算法支持向量机进行实验比较,准确率和F值均高于支持向量机的,原因在于对有多重情感倾向的微博使用情感元素模型判别方式判别更准确。2014年以本文提供的方法参加第三届自然语言处理与中文计算会议发布的中文微博情绪识别与分类评测任务,在五个队伍提交的七组结果中取得第二名好成绩。
【关键词】:中文微博 细粒度情感 多特征 向量机 判别
【学位授予单位】:南华大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1;TP393.092
【目录】:
- 摘要4-6
- Abstract6-12
- 第1章 绪论12-20
- 1.1 课题研究背景及意义12-15
- 1.2 国内外研究现状15-17
- 1.3 本文的主要研究内容17-18
- 1.4 论文组织结构18-20
- 第2章 微博情感分类相关技术20-28
- 2.1 微博情感分类流程20-21
- 2.2 文本预处理21-22
- 2.2.1 中文分词21-22
- 2.2.2 微博去噪22
- 2.3 特征选择与权重计算22-25
- 2.3.1 特征选择22-25
- 2.3.2 特征权重计算25
- 2.4 基于机器学习的文本分类算法25-26
- 2.5 本章小结26-28
- 第3章 中文微博细粒度情感判别方法28-44
- 3.1 中文微博情感细粒度判别流程28-29
- 3.2 基于情感元素模型的微博细粒度情感判别方法29-36
- 3.2.1 情感词来源29-30
- 3.2.2 情感影响因子30-32
- 3.2.2.1 词语级影响因子30-31
- 3.2.2.2 句子级影响因子31-32
- 3.2.3 情感元素模型32-34
- 3.2.3.1 依存句法32-33
- 3.2.3.2 情感元素模型33-34
- 3.2.4 微博细粒度情感判别34-36
- 3.2.4.1 情感权重值计算34-35
- 3.2.4.2 微博细粒度情感判别35-36
- 3.3 基于多特征支持向量机的微博细粒度情感判别方法36-43
- 3.3.1 基于卡方算法的微博情感特征选择37-38
- 3.3.2 基于改进的卡方统计的微博情感特征选择38-39
- 3.3.3 微博情感分类特征39-40
- 3.3.4 基于支持向量机的细粒度判别40-43
- 3.4 本章小结43-44
- 第4章 实验44-52
- 4.1 实验数据44
- 4.2 评价指标44-45
- 4.3 特征选择实验45-47
- 4.4 特征组合实验47-48
- 4.5 NLPCC评测48-49
- 4.5.1 评测指标48-49
- 4.5.2 结果与分析49
- 4.6 情感分类对比实验49-50
- 4.7 本章小结50-52
- 第5章 总结与展望52-54
- 5.1 本文总结52
- 5.2 工作展望52-54
- 参考文献54-58
- 作者攻读学位期间的科研成果58-59
- 致谢59
【相似文献】
中国期刊全文数据库 前10条
1 孙伟;李艳灵;周文勇;;细粒度基于传递功能的约束委托模型[J];信阳师范学院学报(自然科学版);2013年03期
2 夏汛;陈玲;;基于拦截器的细粒度权限设计[J];福建电脑;2012年11期
3 欧阳纯萍;阳小华;雷龙艳;徐强;余颖;刘志明;;多策略中文微博细粒度情绪分析研究[J];北京大学学报(自然科学版);2014年01期
4 史大伟;袁天伟;;一种粗细粒度结合的动态污点分析方法[J];计算机工程;2014年03期
5 原子;于莉莉;刘超;;引入缺陷的细粒度软件变更识别方法[J];北京航空航天大学学报;2014年09期
6 戢彦泓,郭常杰,钟玉琢,孙立峰;基于细粒度可扩展编码的多源视频流化方案[J];清华大学学报(自然科学版);2004年04期
7 涂登彪;谭光明;孙凝晖;;无锁同步的细粒度并行介度中心算法[J];软件学报;2011年05期
8 张宇轩;魏廷存;樊晓桠;张萌;;面向流体系的细粒度异步访存调度[J];计算机应用研究;2012年03期
9 王宽;;基于细粒度调整的同步播放控制算法[J];山西电子技术;2008年05期
10 华秀丽;徐凡;王中卿;李培峰;;细粒度科技论文摘要句子分类方法[J];计算机工程;2012年14期
中国重要会议论文全文数据库 前5条
1 叶蕴芳;杨榆;罗鑫;徐国爱;;Appfuse系统中细粒度权限控制的研究与实现[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 江伟玉;高能;刘泽艺;林雪燕;;一种云计算中的多重身份认证与授权方案[A];第27次全国计算机安全学术交流会论文集[C];2012年
3 郭磊;唐玉华;周杰;董亚卓;;基于FPGA的Cholesky分解细粒度并行结构与实现[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
4 李俊青;谢圣献;刘广亮;陈晨;;P2P网络基于蚁群优化的动态细粒度访问控制框架[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
5 盛振华;吴羽;江锦华;寿黎但;陈刚;;InfoSigs:一种面向WEB对象的细粒度聚类算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国重要报纸全文数据库 前2条
1 赵晓涛;巡展中的三大热门[N];网络世界;2007年
2 乐天邋编译;编织一张更好的Web[N];计算机世界;2007年
中国博士学位论文全文数据库 前4条
1 付兴兵;基于属性基加密的细粒度访问控制机制研究[D];电子科技大学;2016年
2 时杰;关系数据库细粒度访问控制研究[D];华中科技大学;2010年
3 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
4 余a\;基于Simulink模型的细粒度多线程技术研究[D];浙江大学;2014年
中国硕士学位论文全文数据库 前10条
1 赵黎光;基于依存句法的句子级细粒度情感计算[D];华南理工大学;2015年
2 李星宇;一种细粒度Cloud-RAN框架与关键技术研究[D];电子科技大学;2014年
3 郦丽珍;基于Open vSwitch虚拟网络的细粒度访问控制[D];复旦大学;2013年
4 姚亮;数据访问控制中基于中间代理的用户撤销方法[D];西安电子科技大学;2014年
5 占文平;面向产品评论的情感分析技术研究[D];浙江工商大学;2015年
6 楼弘;基于深度神经网络的传感器覆盖细粒度优化研究[D];浙江工业大学;2015年
7 蔡雅雅;基于半监督集成剪枝算法的细粒度城市空气质量估计[D];浙江大学;2016年
8 何东梅;细粒度物体分类算法研究与实现[D];北京交通大学;2016年
9 廖纯;基于句法和语义的话题细粒度情感分析的研究[D];北京理工大学;2016年
10 李毅;属性层级观点挖掘技术的研究与应用[D];石家庄铁道大学;2016年
,本文编号:1111330
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1111330.html