基于改进情感词识别方法的舆情情感分析系统设计
本文关键词:基于改进情感词识别方法的舆情情感分析系统设计,,由笔耕文化传播整理发布。
【摘要】:互联网技术的发展与大数据时代的来临,使得网络已经成为获取信息新的主要渠道之一,其中的网络信息与网络评论的影响力也在显著增加,它为社会舆情的表达与传播提供了温厚的土壤。越来越多的人开始在网络中对于社会时事、热点动态、关注话题各抒已见,而这些文字信息也不断影响着人民对待热点舆情的判断力。因此,对于民众意见等舆情内容的搜集、获取以及情感方面的分析,便成为了一个愈来愈重要的课题。研究发现以往基于情感词识别的情感分析方法中,对于文本信息中情感词的识别手段通常只考虑了词语,而未考虑到词语在整个语句中的成分以及语义关系,因此可能造成分析结果上的误差。对此本文采用了一种优化的情感词识别方法,利用句法分析手段在识别情感词语的基础上,达到准确判断情感词及其修饰词的作用范围的目的。本文将采取由点及面的方法开始论文的呈现和总结,本文主要研究内容及创新性工作包含以下几点:对网络信息的舆情分析技术,主要是国内外文本情感分析的研究现状进行了综述。对舆情系统的设计与实现所需技术如爬虫、设计方法、等进行研究。本文使用Java及Mysql数据库对系统进行设计,利用网络爬取手段进行对舆情信息的抓取。详细介绍了几种不同思路的文本情感倾向分析技术,并各自分析出应用上的特点,并提出在情感词识别的方法上加入句法分析的情感分析方法。详细介绍了基于文本的情感知识获取是对门户网站、微博、博客上的文本内容的获取,达到利用当前网络下的文本信息挖掘其中情感信息的目的。这一研究内容以文本的情感词识别作为基础,包括对文本语法语义的分析、情感程度的表达以及情感强度的计算等,最终得到以文本为输入的情感分析系统。最终,在系统规划完成后,对各分支模块进行了具体实现,通过实际运行结果表明该系统具备不错的舆情情感分析上的效果,值得继续深入研究学习。
【关键词】:舆情分析 Hownet 情感分析 句法分析
【学位授予单位】:北方工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-13
- 1.1 研究背景、研究目的与研究意义8-9
- 1.2 国内外研究及应用现状9-11
- 1.2.1 舆情分析技术应用的国内外现状10
- 1.2.2 文本情感分析技术应用的国内外现状10-11
- 1.3 本论文主要工作及论文的组织结构11-13
- 第二章 相关技术与理论基础13-24
- 2.1 网络爬虫技术13-16
- 2.1.1 网络爬虫的原理13-14
- 2.1.2 网络爬虫遵循的规则14-15
- 2.1.3 爬虫的多线程爬取15
- 2.1.4 爬虫的分布式策略15-16
- 2.2 网页文本预处理技术16-21
- 2.2.1 网页的结构16-18
- 2.2.2 基于DOM树的网页正文提取方法18-19
- 2.2.3 基于网页分割布局块的正文提取方法19
- 2.2.4 基于标记窗的正文提取方法19-20
- 2.2.5 基于行块分布的网页正文提取方法20-21
- 2.3 中文分词及词性标注技术21-24
- 2.3.1 中文分词技术21-23
- 2.3.2 词性标注技术23-24
- 第三章 网络舆情情感分析关键技术研究24-36
- 3.1 情感建模25-26
- 3.2 情感词库的建立26-28
- 3.3 情感分析方法的介绍28-36
- 3.3.1 基于机器学习分类的文本情感分析方法29-30
- 3.3.2 基于语义规则的情感分析方法30-31
- 3.3.3 基于情感词识别的情感分析方法31-32
- 3.3.4 改进的基于情感词识别的情感分析方法32-36
- 第四章 系统设计36-42
- 4.1 系统需求36-37
- 4.2 系统整体架构37-38
- 4.3 系统开发环境38-40
- 4.4 系统所依赖的开源项目40-41
- 4.4.1 Hanlp中文自然语言处理包40-41
- 4.4.2 WebCollector41
- 4.4.3 Java Swing GUI图形界面制作工具41
- 4.5 小结41-42
- 第五章 系统实现42-49
- 5.1 舆情搜集模块的实现42-43
- 5.2 数据储存模块的建立43-44
- 5.3 舆情内容预处理模块的实现44
- 5.4 舆情情感分析模块的实现44-46
- 5.5 系统界面的实现46-49
- 第六章 系统测试和结果分析49-56
- 6.1 实验结果与分析49-50
- 6.2 系统界面展示50-52
- 6.3 实际系统运行示例52-56
- 第七章 结束语56-58
- 7.1 论文总结56-57
- 7.2 问题与展望57-58
- 参考文献58-61
- 攻读硕士学位期间发表的论文和获得的科研成果61-62
- 致谢62
【相似文献】
中国期刊全文数据库 前10条
1 许璐蕾;;网络评论中情感词的获取及极性判断方法比较[J];电脑与电信;2011年01期
2 肖健;徐建;朱姝;万缨;许亮;;基于翻译和语义方法的情感词挖掘研究[J];计算机工程与应用;2011年32期
3 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期
4 代大明;李寿山;李培峰;朱巧明;;基于情绪词与情感词协作学习的情感分类方法研究[J];计算机科学;2012年12期
5 李勇敢;周学广;孙艳;张焕国;;结合依存关联分析和规则统计分析的情感词库构建方法[J];武汉大学学报(理学版);2013年05期
6 彭庆喜;钱铁云;;基于量化情感的网店垃圾评论检测[J];山东大学学报(理学版);2013年11期
7 杜嘉忠;徐健;刘颖;;网络商品评论的特征 情感词本体构建与情感分析方法研究[J];现代图书情报技术;2014年05期
8 张清亮;徐健;;网络情感词自动识别方法研究[J];现代图书情报技术;2011年10期
9 黄俊;田生伟;禹龙;冯冠军;;基于维吾尔语情感词的句子情感分析[J];计算机工程;2012年09期
10 孙劲光;马志芳;孟祥福;;基于情感词属性和云模型的文本情感分类方法[J];计算机工程;2013年12期
中国重要会议论文全文数据库 前5条
1 陈奇哲;刘全升;姚天f ;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
3 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 王枞;涂序彦;刘嘉;;注意-情绪协调的个性化信息推荐模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前8条
1 刘全超;面向中文微博的观点挖掘与倾向性分析研究[D];北京理工大学;2015年
2 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年
3 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
4 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年
5 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年
6 施寒潇;细粒度情感分析研究[D];苏州大学;2013年
7 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
8 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 孙博;关于情感词的意义用法[D];辽宁大学;2012年
2 王银;中文微博情感分析方法研究[D];广东技术师范学院;2015年
3 崔连超;互联网评论文本情感分析研究[D];山东大学;2015年
4 杜雪峰;藏文句子倾向性分析研究[D];中央民族大学;2015年
5 孙建超;微博舆情挖掘技术的研究与应用[D];电子科技大学;2015年
6 张圣声;基于微博平台的产品评论情感分类研究[D];广东外语外贸大学;2015年
7 何天翔;基于情感词网的短文本情感分类方法研究[D];西南科技大学;2015年
8 丁星;基于文本倾向性分析技术的微博监控系统[D];江苏科技大学;2015年
9 李茜;博客意见检索关键问题研究[D];北京理工大学;2015年
10 李瑞静;汉语情感词模糊语义的量化分析及应用研究[D];北京理工大学;2015年
本文关键词:基于改进情感词识别方法的舆情情感分析系统设计,由笔耕文化传播整理发布。
本文编号:262844
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/262844.html