基于红网的情感分析与预测系统设计与实现
发布时间:2020-08-22 13:07
【摘要】:现如今互联网已经遍布在人们生活的每一个角落,越来越多的人参与到互联网评论之中,在论坛、购物网站评论区等地方发表自己的意见。然而,由于互联网的开放性在某种程度上滋生了谣言,同时互联网的信息传递速度也加速了谣言的传播,对社会的稳定产生了极大的危害。因此对网络舆情的分析预测和监控就显得尤为重要。本系统旨在帮助政府了解网络民情民意、了解政策实施后网络民意的变化。同时为更好的规范网络舆论,进一步提高政府管理能力提供了技术支持。本系统以红网热门话题以及话题的评论信息为研究对象,依据文本情感分析技术和当前的话题趋势预测的研究,设计实现了一个具有舆情监控和趋势预测功能的网络舆情分析系统。本文的主要研究内容包括:首先,阐述了本系统的研究背景和意义,介绍了文本情感分析方向的国内外研究现状,总结了实现本系统所需采用的关键技术和理论知识。以及对本系统的功能需求进行分析。其次,根据需求分析确定本系统的设计方案并进行实现。主要分为页面信息收集、情感倾向分析和舆情演化趋势预测三大模块。通过利用网络爬虫技术获取相关数据并建立索引。采用基于语义的情感分析技术对网民对话题所持有的积极情感、消极情感和中立态度进行分析和监控,并运用可视化技术将相关情感采用图表形式展现。最后,本系统采用当前学者提出考虑话题点击率、回复率和情感倾向评分的热度值计算方法和使用Gamma模型对舆情演化趋势进行预测,以及对想法进行了验证和实现。本文最后对“湘潭九华开发区新建垃圾焚烧厂”事件进行了一个月的统计数据,通过其态势预测模块所得的表格绘制了散点图、折线图,发现系统预测的话题发展曲线与话题现实中的演化趋势大致相同,较好地完成了舆情演化趋势的预测功能。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.52
【图文】:
网络爬虫的设计形式
图 2.2 HtmlPaser 使用 Node 对象保存各节点信息(5) 访问各个节点的方法Node getParent ():提取父节点NodeList getChildren ():提取子节点的列表
这使得软件开发人员在目标系统上使用全文搜索更为容易。图 2.3 Lucene 的结构图从图 2.3 可以看出,Lucene 的体系由三部分组成:基础设施封装、索引核心和外部接口。Lucene 在搜索方面有下列优势:(1) 索引文件的格式与应用于何种平台无关。(2) 实现了分块索引,并且为新文件建立小文件索引,大大提高索引效率,并与原始索引融合来提高性能。(3) 应用非面向过程化体系构造,致使 Lucene 扩展的使用难度下降,便于增添新功能。(4) 索引创建者接受 Token 流并完成索引文件的创建。(5) 默许情况下用户不需要通过自己编程就可以使系统得到高效的查询功能,对于一直以来的商业全文检索类引擎,Lucene 也显示了十分突出的优势。
本文编号:2800725
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.52
【图文】:
网络爬虫的设计形式
图 2.2 HtmlPaser 使用 Node 对象保存各节点信息(5) 访问各个节点的方法Node getParent ():提取父节点NodeList getChildren ():提取子节点的列表
这使得软件开发人员在目标系统上使用全文搜索更为容易。图 2.3 Lucene 的结构图从图 2.3 可以看出,Lucene 的体系由三部分组成:基础设施封装、索引核心和外部接口。Lucene 在搜索方面有下列优势:(1) 索引文件的格式与应用于何种平台无关。(2) 实现了分块索引,并且为新文件建立小文件索引,大大提高索引效率,并与原始索引融合来提高性能。(3) 应用非面向过程化体系构造,致使 Lucene 扩展的使用难度下降,便于增添新功能。(4) 索引创建者接受 Token 流并完成索引文件的创建。(5) 默许情况下用户不需要通过自己编程就可以使系统得到高效的查询功能,对于一直以来的商业全文检索类引擎,Lucene 也显示了十分突出的优势。
【参考文献】
相关期刊论文 前10条
1 黄高峰;周学广;;一种语句级细粒度情感倾向性分析算法研究[J];计算机应用与软件;2015年04期
2 乐国安;董颖红;;情绪的基本结构:争论、应用及其前瞻[J];南开学报(哲学社会科学版);2013年01期
3 吕韶华;杨亮;林鸿飞;;基于SimRank的跨领域情感倾向性分析算法研究[J];中文信息学报;2012年06期
4 葛斌;李芳芳;郭丝路;汤大权;;基于知网的词汇语义相似度计算方法研究[J];计算机应用研究;2010年09期
5 闻彬;何婷婷;罗乐;宋乐;王倩;;基于语义理解的文本情感分类方法研究[J];计算机科学;2010年06期
6 樊娜;蔡皖东;赵煜;李慧贤;;中文文本情感主题句分析与提取研究[J];计算机应用;2009年04期
7 熊德兰;程菊明;田胜利;;基于HowNet的句子褒贬倾向性研究[J];计算机工程与应用;2008年22期
8 叶强;张紫琼;罗振雄;;面向互联网评论情感分析的中文主观性自动判别方法研究[J];信息系统学报;2007年01期
9 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[J];中文信息学报;2007年01期
10 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
相关硕士学位论文 前1条
1 张硕果;基于条件随机场模型的文本分类研究[D];重庆大学;2010年
本文编号:2800725
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2800725.html