当前位置:主页 > 经济论文 > 国际贸易论文 >

关于酒店评论情感倾向的统计分析

发布时间:2020-12-19 14:28
  随着互联网+的逐渐普及,越来越多的商品采取线上的形式进行销售,不仅包括实物类商品,还有诸多服务类商品(酒店预订、在线打车、家政服务等)。消费者也不仅仅是商品信息的获取方,更多时候可以作为信息的输出方,对商品进行评价、描述、建议,海量的商品加上海量的数据,这也导致互联网的信息量呈指数型的增长。通过对这些文本信息进行分析,识别出潜在有价值的内容,了解这些信息的情感倾向——积极或是消极等,有助于挖掘出其中更有价值的内容,帮助商家获取新的市场机遇,给出消费者更多更好的消费意见,给人们带来生活上的便利。但在如此海量级别的信息数据下,想要了解用户对商品的评价情感,只靠人力去解读这些信息,工作量巨大,还存在许多主观意识和客观环境的影响。因此,为了更方便迅速的了解用户对商品评价的情感趋势,提取大数据下的有效信息,本文采取机器学习和深度学习等方法,针对收集的酒店评论数据集(包含覃建波老师的10000条和网络爬虫获取的5000条酒店评论数据集,积极语料和消极语料的比例为2:1)来进行情感分类分析,为消费者和商家带来对于商品信息更为直观的认识。本文最终通过一系列的模型训练,选择出效果较为理想的模型,能够将评... 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:54 页

【学位级别】:硕士

【部分图文】:

关于酒店评论情感倾向的统计分析


图2.2?PV-DM模型图??PV-DBOW模型则与PV-DM模型有所不同,它输入的就是段落的向量,并且采??

示意图,示意图,样本点,原数据


绿色的点为待测样本,灰色三角与红色正方形均为原数据样本点,??sl和class2两类,在给定k=l的情况下,与待测数据距离最近的一个点??形,则绿色样本点被分类到dass2。在给定k=5的情况下,距离待测样??5个原数据样本点为3个灰色三角和2两个红色正方形,那么待测样本??classl。因此k值的选择是十分重要的,对于待测数据的预测结果有着??邻算法中,通过计算对象间距离来作为各个对象之间的非相似性指标,??之间的匹配问题,在这里距离一般使用欧氏距离或曼哈顿距离:??式距离:〇^,乂)=反(x广凡)??V是=1??距离:6?(1,>0?=?^^丨:^->^丨??近邻算法的具体描述为:??算待测数据点与训练数据点之间的距离;??离的远近程度,依次排序这些训练数据点;??择距离最短的K个样本点;??前K个点在所在类别出现的频率;??个点中出现频率最高的点作为测试数据点的预测分类。??

示意图,原数据,示意图,误差率


图3.2?6折交叉示意图??上图所示,第一行为原数据集,被均等切分为了?6份。第二到七行分别代表??数据中选取一份作为测试集,其他作为训练集的切分结果。在这六种不同的??据上,分别进行模型训练,在测试集上得到误差率,最后平均下来即是K折??证的误差率。一般来讲,折交叉验证法的K一般是大于2的,不然就没有交??的意义了。K折交叉验证法可以有效的避免过拟合以及欠拟合状态的发生,??

【参考文献】:
期刊论文
[1]基于多任务深度学习的文本情感原因分析[J]. 余传明,李浩男,安璐.  广西师范大学学报(自然科学版). 2019(01)
[2]基于文本挖掘的我国人工智能产业政策量化研究[J]. 袁野,于敏敏,陶于祥,龚振炜,刘继明.  中国电子科学研究院学报. 2018(06)
[3]基于改进的K-means算法在文本挖掘中的应用[J]. 杨丹,朱世玲,卞正宇.  计算机技术与发展. 2019(04)
[4]Convolutional Neural Network Based on Spatial Pyramid for Image Classification[J]. Gaihua Wang,Meng Lü,Tao Li,Guoliang Yuan,Wenzhou Liu.  Journal of Beijing Institute of Technology. 2018(04)
[5]Real-time object segmentation based on convolutional neural network with saliency optimization for picking[J]. CHEN Jinbo,WANG Zhiheng,LI Hengyu.  Journal of Systems Engineering and Electronics. 2018(06)
[6]在线评论文本挖掘对电商的影响研究[J]. 崔永生.  中国商论. 2018(33)
[7]基于深度学习的多维特征微博情感分析[J]. 金志刚,胡博宏,张瑞.  中南大学学报(自然科学版). 2018(05)
[8]基于卷积神经网络的文档特征提取方法[J]. 刘钢,李宗晨,郭建伟.  江苏科技信息. 2018(14)
[9]招聘过程中中小企业与求职者间的博弈分析[J]. 贺琦.  人才资源开发. 2017(24)
[10]基于卷积神经网络模型的互联网短文本情感分类[J]. 刘小明,张英,郑秋生.  计算机与现代化. 2017(04)

博士论文
[1]提取商品特征和情感词的语义约束LDA模型研究[D]. 彭云.江西财经大学 2016

硕士论文
[1]基于向量空间模型的文本内容筛查方法研究[D]. 蔡礼高.电子科技大学 2018
[2]基于词典和机器学习组合的情感分析[D]. 丁蔚.西安邮电大学 2017
[3]多层卷积神经网络深度学习算法的应用研究[D]. 张万亚.西安电子科技大学 2017
[4]基于深度神经网络的微博短文本情感分析研究[D]. 张英.中原工学院 2017
[5]基于演化博弈论的人力资本定价研究[D]. 董江鹏.天津大学 2017
[6]企业员工招聘中信息不对称的演化博弈分析[D]. 刘金凤.东北石油大学 2012
[7]企业招聘中的大学生诚信缺失研究[D]. 吕军战.西北大学 2011



本文编号:2926060

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2926060.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4065f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com