基于舆情系统的食品安全信息情感倾向性研究
发布时间:2024-05-12 01:42
随着互联网技术的快速发展,文本数据每天都在呈爆炸式增长,这些数据包含了用户在微博、微信、论坛等社交媒体平台所发表的动态信息、各大新闻媒体门户网站的新闻内容、各个电商网站下商品的评论信息、用户往来沟通的帖子邮件等,这些文本数据看似复杂,实则蕴含着大量有用信息,包含了公众的观点以及情感倾向。近来年,针对文本情感分析的研究逐渐增多,这些研究可以帮助企业了解用户对某一商品或服务的情感态度,还可以针对某些热点舆情事件,为相关单位制定一些政策提供决策支持,及时疏导负面情绪等。本文主要从跟人们生活息息相关的食品安全信息出发,以“非洲猪瘟”为例,借助中国吉林网舆情系统中公众关于“非洲猪瘟”事件的原创型评论数据,采用机器学习的方法对其进行情感倾向性分析。主要研究内容如下:(1)情感分析理论概况情感分析作为自然语言处理的一个重要研究领域,需要了解与学习其中的相关理论知识,包括自然语言处理的方法,情感分析的概念、目标,在不同的应用场景下,情感分析所需要的完成的任务,以及根据所处理的文本粒度不同,情感倾向性分析可以划分三个级别等。(2)关键技术研究中文文本情感分析的首要任务,需要对文本进行预处理,包括:中文分...
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
本文编号:3970672
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图2.1某购物网站的评价页面
见图2.1,从评价可以分析得到:客户对人参有苦味和颜色是黑色的情况不是很满意,那么就要考虑人参品质的问题,及时调整自家的产品质量。(2)舆情分析方面
图2.2文本粒度划分
根据所处理文本的颗粒度,情感倾向性研究可以划分三个级别:篇章级、句子级和属性级,见图2.2。(1)篇章级情感分析
图3.1主流分词方法
中文分词的方法可主要归纳为基于词典的规则分词方法、基于概率的统计分词方法以及两者混合的方法[22],见图3.1。基于词典的规则分词是早期的分词方法,通过人工整理一些分词词库,将文本中的词语按照一定的规则进行匹配,匹配成功则切分出该词语,实践过程相对容易,但是该方法对未登陆词却很难....
图3.2词性标注方法
词性标注的方式分为三大类:基于词典的匹配查找方法、基于统计的方法以及两者混合的方法,见图3.2:基于字符串匹配的词典查找方法是先对文本进行分词处理,然后从词典中查找每个词语的词性,见表3-1,对其标注即可,该标注方法的优点是标注过程相对简单高效,但是该方法需要人工制定消除歧义规则....
本文编号:3970672
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3970672.html