基于卷积神经网络的在线商品评论情感倾向性研究
本文选题:垃圾评论识别 切入点:情感倾向性分析 出处:《大连理工大学》2016年硕士论文 论文类型:学位论文
【摘要】:随着互联网规模和重要性的不断增长,在线商品评论的数量和影响日益剧增。在线商品评论通常是消费者做购买产品或服务的决策时十分重要的影响因素,也是确定这些产品或服务民意信息的宝贵来源。挖掘在线商品评论所携带的情感信息,分析消费者的情感倾向,对在线零售商和服务提供商均有着重要的意义。由于研究人员在情感倾向性分析领域孜孜不倦的努力,迄今为止,情感倾向性研究取得了较大的进展。在线商品评论中蕴含着消费者的主观情感信息,为了获取消费者的情感倾向性,需要利用自然语言处理的方式,处理评论文本。受限于语言的复杂多变,长期以来,自然语言处理都是一项十分艰难的任务,再加上在线商品评论中不可避免的包含垃圾评论,这便使得利用在线商品评论挖掘消费者情感倾向性存在以下两个需要解决的问题:(1)垃圾评论在一定程度上误导了观点挖掘系统,降低了系统的精度,如何解决垃圾评论问题,减少垃圾评论对系统的影响,是倾向性分析所面临的问题之一(2)针对在线商品评论复杂的语言现象,如何捕捉新词、否定词、比较词、不同情感倾向性的情感词对评论情感倾向性的影响,能否构建一个合理的在线评论情感倾向性分析模型,是提高评论倾向性分析的关键所在。本文针对上述问题,确立研究内容。主要工作如下:(1)针对垃圾评论影响倾向性分析的问题,本文提出了一种基于模型集成的产品垃圾评论识别方法。该方法利用评论内容和统计信息构造特征向量,将逻辑斯蒂回归作为次级学习器,通过stacking的方式集成了逻辑斯蒂回归、支持向量机、随机森林、神经网络等初级学习器。该方法在2015年第七届中文倾向性分析评测垃圾评论识别任务的所有模型中表现较好。(2)针对在线产品评论的特点,本文提出了一种基于卷积神经网络的产品评论情感倾向性分析方法。该方法以单个字为基本单位,利用worde2vec工具训练字级别词向量,将字级别词向量作为输入,利用不同大小的卷积核抽取句子特征,最后利用softmax模型对在线商品评论进行情感倾向性分类。实验表明,本文构建的模型能够较准确的识别在线商品评论的情感倾向性。
[Abstract]:Along with the increasing scale of the Internet and the importance of online product reviews and the number increase. The online product reviews are usually very important factors affecting consumers to buy products or services when making decisions, but also to determine these products or services and public information sources. Precious mining carried online product reviews of the emotional information, analysis of emotion on the tendency of consumers, online retailers and service providers are of great significance. The researchers analyzed the field in sentiment diligently efforts, so far, has made great progress in the research of emotional tendencies. Online product reviews are contained in the consumer's subjective emotional information, in order to obtain consumer sentiment, need to use Natural Language Processing's way of processing text. Due to the language of the complex, long, natural language. Science is a very difficult task, coupled with the inevitable online product reviews contain comment spam, which makes use of online product reviews mining has the following two problems to solve consumer sentiment: (1) spam to a certain extent, misleading the opinion mining system, reduce system how to solve the problem of accuracy, spam, spam to reduce the impact on the system, is one of the problems facing the tendency analysis (2) for the online product reviews the complicated language phenomenon, how to capture new words, negative words, compare the effect of different words, emotional tendency of emotional words of commentary on the emotional tendency, the establishment of a reasonable online review sentiment analysis model, is the key to improve analysis tendency. Aiming at the above problems, the establishment of research contents. The main work is as follows: (1) according to the Spam influence tendency analysis problem, this paper proposes a model of integrated product review spam recognition method based on this method. Using the comment content and statistical information of feature vectors are constructed, the logistic regression as a secondary learning device, by way of stacking integrated logistic regression, support vector machine, random forests, neural network primary learners. All evaluation spam recognition tasks with good performance in the analysis of this method in 2015 seventh Chinese tendency. (2) according to the characteristics of online product reviews, this paper proposes an analysis method of product review sentiment based on convolutional neural network. This method takes a single word as the basic unit. Using the worde2vec tool training level word word vector, word level word vector as input, using convolution kernel sentence extraction characteristics of different sizes, the use of softm Ax model is used to sentiment sentiment classification on online reviews. Experiments show that the model constructed in this paper can accurately identify the sentiment tendency of online reviews.
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1;TP183
【相似文献】
相关期刊论文 前10条
1 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
2 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期
3 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期
4 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期
5 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期
6 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期
7 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期
8 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期
9 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期
10 杨钟瑾;;神经网络的过去、现在和将来[J];青年探索;2006年04期
相关会议论文 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年
3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年
4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
7 健康时报特约记者 张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年
8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年
9 ;神经网络和模糊逻辑[N];世界金属导报;2002年
10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年
相关博士学位论文 前10条
1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年
相关硕士学位论文 前10条
1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年
2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年
3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年
4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年
6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年
7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年
8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年
,本文编号:1615756
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1615756.html