产品评论中的用户建议挖掘研究与实现
发布时间:2021-07-14 00:36
随着互联网和电子商务的快速发展,越来越多的人选择在网上购买商品或者服务。在市场竞争白热化的情况下,商家需要及时发现消费者对产品的一些新需求,以提高产品的市场接受度和竞争力。而产品评论中的用户建议描述了用户对产品或企业提出的一些具体建议,可以帮助企业改进后续产品和制定相应的营销策略,具有十分重要的应用价值,需要对其进行挖掘。对产品评论中的用户建议挖掘研究而言,首要任务是从大量的产品评论中检测出包含用户建议的评论。本文针对建议检测任务中缺少相关数据集、中文建议表达方式灵活、特征构建困难、人工标注工作量大等问题进行研究,并以此为基础构建了产品评论中的用户建议挖掘原型系统主要模块。具体而言,本文的主要研究内容如下:1.首先针对缺乏建议挖掘标注数据集的问题,抓取数据并人工构造了关于中文产品评论的建议挖掘数据集。接着提出了一种集成学习模型来进行建议语句分类。首先使用Stacking组合分类器来构建概率特征空间,使用卷积神经网络和段落向量模型分别构建评论文本的卷积神经网络特征空间和段落向量特征空间,然后对上述特征进行融合,并训练Bagging分类器来对建议语句分类。在中文数据集上的实验结果表明了本研...
【文章来源】:重庆邮电大学重庆市
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
在线评论示意图
图 3.1 显式和隐式建议语句示例究者们在产品评论、推文等类型的数据集上开展了建议研究进展,但已有研究均是在英文语料上开展的,从国内在中文数据集上开展的相关研究。不同于英文,中文环富,呈现出许多与英文不同的特点,需要研究新的方法以上考虑,本研究从产品论坛中收集标注了可用于建议了一种能融合评论文本多种特征的集成学习模型,首次究。该模型通过使用 Stacking 组合分类器、改进的 CN多种文本特征空间,接着进行特征融合,训练集成学习通过与多种机器学习分类模型进行实验对比,实验结果议语句分类方面的有效性。构建
图 3.4 Pos-TextCNN 模型结构段落向量特征空间的构建N 网络模型可以比较好的学习到较强的局部特征和一定长度的上下中文中,构成建议表达的词组可能相距很远。例如“如果三星智付支就好了”,只有看完整句话,根据“如果…就好”才可以判断这句话。所以本章考虑对整个文档构建段落特征向量表示。不同于之前的词 特征,段落向量包含了文档中整体的语序、语义及上下文信息,可以CNN 特征进行互补。本章使用 PV 模型来构建段落向量特征空间。监督式算法,可以将文本作为一个整体,用段落向量进行表示[29]。PV括 PV-DM(Distributed Memory Model of Paragraph Vectors) (Distributed Bag of Words version of Paragraph Vector)两种训练方式来
【参考文献】:
期刊论文
[1]文本情绪分析综述[J]. 李然,林政,林海伦,王伟平,孟丹. 计算机研究与发展. 2018(01)
[2]一种用于构建用户画像的二级融合算法框架[J]. 李恒超,林鸿飞,杨亮,徐博,魏晓聪,张绍武,古丽孜热·艾尼外. 计算机科学. 2018(01)
[3]基于CNN特征空间的微博多标签情感分类[J]. 孙松涛,何炎祥. 工程科学与技术. 2017(03)
[4]基于自编码网络特征降维的轻量级入侵检测模型[J]. 高妮,高岭,贺毅岳,王海. 电子学报. 2017(03)
[5]基于支持向量机的PU中文文本分类器构建[J]. 王宗尧,刘金岭. 南京邮电大学学报(自然科学版). 2015(06)
[6]自编码网络短文本流形表示方法[J]. 魏超,罗森林,张竞,潘丽敏. 浙江大学学报(工学版). 2015(08)
[7]基于全局变量CRFs模型的微博情感对象识别方法[J]. 郝志峰,杜慎芝,蔡瑞初,温雯. 中文信息学报. 2015(04)
[8]基于PU学习算法的虚假评论识别研究[J]. 任亚峰,姬东鸿,张红斌,尹兰. 计算机研究与发展. 2015(03)
[9]一种基于聚类的PU主动文本分类方法[J]. 刘露,彭涛,左万利,戴耀康. 软件学报. 2013(11)
[10]基于Stacking组合分类方法的中文情感分类研究[J]. 李寿山,黄居仁. 中文信息学报. 2010(05)
本文编号:3283041
【文章来源】:重庆邮电大学重庆市
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
在线评论示意图
图 3.1 显式和隐式建议语句示例究者们在产品评论、推文等类型的数据集上开展了建议研究进展,但已有研究均是在英文语料上开展的,从国内在中文数据集上开展的相关研究。不同于英文,中文环富,呈现出许多与英文不同的特点,需要研究新的方法以上考虑,本研究从产品论坛中收集标注了可用于建议了一种能融合评论文本多种特征的集成学习模型,首次究。该模型通过使用 Stacking 组合分类器、改进的 CN多种文本特征空间,接着进行特征融合,训练集成学习通过与多种机器学习分类模型进行实验对比,实验结果议语句分类方面的有效性。构建
图 3.4 Pos-TextCNN 模型结构段落向量特征空间的构建N 网络模型可以比较好的学习到较强的局部特征和一定长度的上下中文中,构成建议表达的词组可能相距很远。例如“如果三星智付支就好了”,只有看完整句话,根据“如果…就好”才可以判断这句话。所以本章考虑对整个文档构建段落特征向量表示。不同于之前的词 特征,段落向量包含了文档中整体的语序、语义及上下文信息,可以CNN 特征进行互补。本章使用 PV 模型来构建段落向量特征空间。监督式算法,可以将文本作为一个整体,用段落向量进行表示[29]。PV括 PV-DM(Distributed Memory Model of Paragraph Vectors) (Distributed Bag of Words version of Paragraph Vector)两种训练方式来
【参考文献】:
期刊论文
[1]文本情绪分析综述[J]. 李然,林政,林海伦,王伟平,孟丹. 计算机研究与发展. 2018(01)
[2]一种用于构建用户画像的二级融合算法框架[J]. 李恒超,林鸿飞,杨亮,徐博,魏晓聪,张绍武,古丽孜热·艾尼外. 计算机科学. 2018(01)
[3]基于CNN特征空间的微博多标签情感分类[J]. 孙松涛,何炎祥. 工程科学与技术. 2017(03)
[4]基于自编码网络特征降维的轻量级入侵检测模型[J]. 高妮,高岭,贺毅岳,王海. 电子学报. 2017(03)
[5]基于支持向量机的PU中文文本分类器构建[J]. 王宗尧,刘金岭. 南京邮电大学学报(自然科学版). 2015(06)
[6]自编码网络短文本流形表示方法[J]. 魏超,罗森林,张竞,潘丽敏. 浙江大学学报(工学版). 2015(08)
[7]基于全局变量CRFs模型的微博情感对象识别方法[J]. 郝志峰,杜慎芝,蔡瑞初,温雯. 中文信息学报. 2015(04)
[8]基于PU学习算法的虚假评论识别研究[J]. 任亚峰,姬东鸿,张红斌,尹兰. 计算机研究与发展. 2015(03)
[9]一种基于聚类的PU主动文本分类方法[J]. 刘露,彭涛,左万利,戴耀康. 软件学报. 2013(11)
[10]基于Stacking组合分类方法的中文情感分类研究[J]. 李寿山,黄居仁. 中文信息学报. 2010(05)
本文编号:3283041
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3283041.html