融合隐式评价内容的意见挖掘技术研究与实现
发布时间:2021-08-28 13:14
在电商网站不断增加的时代,用户的评论信息也在不断的增多。用户通过浏览某个产品的网络评论得到数据支持服务,借此深入了解产品,并在用户决策时提供参考;商家通过挖掘用户的反馈意见,指导后续改进产品和服务的质量。关于网络评论的意见挖掘技术得到广泛的研究。意见挖掘中评价对象的抽取是很多研究者关注的问题,其中明确表达评论属性的显式评价对象获得了较多研究。包含隐式评价内容的用户意见挖掘为用户和商家提供了更加丰富的评论意见。因此,本文结合隐式评价内容对用户意见挖掘技术进行了研究与应用,主要工作如下:1)提出了显式评价对象与评价词抽取方法。根据评价对象抽取任务的粒度不同,可将其整理为语料级别和语句级别的抽取。针对语料级别的抽取任务,本文提出一种融合语义依存关系和BTM的Biterm*Topic Model语料级别评价对象抽取模型;针对语句级别的抽取任务,本文提出了基于BiLSTM-CRF与不同权值的词嵌入向量和词性嵌入向量相结合的WeightN-BiLSTM-CRF语句级别评价对象抽取模型。使用不同的抽取模型抽取出不同级别的文本中的评价对象与评价词。2)针对意见挖掘中的隐式评价对象...
【文章来源】:河北科技大学河北省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
方案处理过程
题模型通过对每个文档中词或词组的生成进行建模,利揭示语料库的潜在语义结构。这些方法对短文本很敏感共现模式是稀疏的,而且不可靠。相反,如果将语料库起来,它们的频率就会更稳定,更清楚地揭示出单词之,产生了双词话题模型(Biterm Topic Model)[44]。pic Model(BTM)打破传统主题模型的文档-主题层,通理短文本的特殊性。双词(Biterm)表示一个短的上下文这里一个短的上下文是指一个术语序列上的一个小的固限的短文本中,比如推文和文本消息,可以简单地将每元。在这种情况下,文档中的任何两个不同的单词构成中有三个不同的词或者词组,组成的三个词对如下: {( w1,w2),( w2,w3),( w1,w3)}无序的,并且展示了词的共现关系。换句话说两个词共的语义越相关,属于同一话题的可能性就越高。在每个料库现在变成一个词对集。
图 2-2 CRF 结构图习框架rch一个基于 Torch 的 Python 开源机器学习库,用于自然心提供定义数学函数和计算其梯度的能力[52]。PyTorch 量 Tensor 的计算(如 numpy),其具有强大的 GPU 加上自动调整系统,所构建的深度神经网络。大优点就是作为一个动态的而不是静态的计算图形框自然语言处理,例如循环神经网络(Recurrent Neural N的输出。其一,动态框架允许开发者编写常规的 Pytho试,来开发的神经网络逻辑。其二,Pytorch 允许开发个算法中发生的事情。如果说明了某种计算,静态计算像黑盒一样被处理。然而使用动态方法,则能够全部是如何计算。
【参考文献】:
期刊论文
[1]基于深度学习的中文微博评价对象抽取方法[J]. 张璞,陈韬,陈超,王永. 计算机工程与设计. 2018(08)
[2]网络产品评论细粒度意见挖掘研究综述[J]. 颜端武,江蕊,杨雄飞,鞠宁. 现代情报. 2018(07)
[3]基于主题标签和CRF的中文微博命名实体识别[J]. 朱颢东,杨立志,丁温雪,冯嘉美. 华中师范大学学报(自然科学版). 2018(03)
[4]基于多通道卷积神经网络的中文微博情感分析[J]. 陈珂,梁斌,柯文德,许波,曾国超. 计算机研究与发展. 2018(05)
[5]基于卷积记忆神经网络的微博短文本情感分析[J]. 郑啸,王义真,袁志祥,秦锋. 电子测量与仪器学报. 2018(03)
[6]使用深度长短时记忆模型对于评价词和评价对象的联合抽取[J]. 沈亚田,黄萱菁,曹均阔. 中文信息学报. 2018(02)
[7]基于条件随机场的评价对象抽取[J]. 夏圆,张征. 计算机系统应用. 2017(11)
[8]基于LSTM网络的评价对象和评价词抽取[J]. 李盛秋,赵妍妍,秦兵,刘挺. 智能计算机与应用. 2017(05)
[9]基于半监督CRF的跨领域中文分词[J]. 邓丽萍,罗智勇. 中文信息学报. 2017(04)
[10]基于句法结构的评价对象抽取方法研究[J]. 杨云. 长春教育学院学报. 2017(06)
硕士论文
[1]基于词嵌入的个性化推荐系统的研究[D]. 孟天宏.河北科技大学 2018
[2]网购用户评论中隐式评价对象的提取方法研究[D]. 马京苗.北京交通大学 2017
[3]产品评论中隐式评价对象的抽取研究[D]. 曾令伟.上海交通大学 2014
本文编号:3368580
【文章来源】:河北科技大学河北省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
方案处理过程
题模型通过对每个文档中词或词组的生成进行建模,利揭示语料库的潜在语义结构。这些方法对短文本很敏感共现模式是稀疏的,而且不可靠。相反,如果将语料库起来,它们的频率就会更稳定,更清楚地揭示出单词之,产生了双词话题模型(Biterm Topic Model)[44]。pic Model(BTM)打破传统主题模型的文档-主题层,通理短文本的特殊性。双词(Biterm)表示一个短的上下文这里一个短的上下文是指一个术语序列上的一个小的固限的短文本中,比如推文和文本消息,可以简单地将每元。在这种情况下,文档中的任何两个不同的单词构成中有三个不同的词或者词组,组成的三个词对如下: {( w1,w2),( w2,w3),( w1,w3)}无序的,并且展示了词的共现关系。换句话说两个词共的语义越相关,属于同一话题的可能性就越高。在每个料库现在变成一个词对集。
图 2-2 CRF 结构图习框架rch一个基于 Torch 的 Python 开源机器学习库,用于自然心提供定义数学函数和计算其梯度的能力[52]。PyTorch 量 Tensor 的计算(如 numpy),其具有强大的 GPU 加上自动调整系统,所构建的深度神经网络。大优点就是作为一个动态的而不是静态的计算图形框自然语言处理,例如循环神经网络(Recurrent Neural N的输出。其一,动态框架允许开发者编写常规的 Pytho试,来开发的神经网络逻辑。其二,Pytorch 允许开发个算法中发生的事情。如果说明了某种计算,静态计算像黑盒一样被处理。然而使用动态方法,则能够全部是如何计算。
【参考文献】:
期刊论文
[1]基于深度学习的中文微博评价对象抽取方法[J]. 张璞,陈韬,陈超,王永. 计算机工程与设计. 2018(08)
[2]网络产品评论细粒度意见挖掘研究综述[J]. 颜端武,江蕊,杨雄飞,鞠宁. 现代情报. 2018(07)
[3]基于主题标签和CRF的中文微博命名实体识别[J]. 朱颢东,杨立志,丁温雪,冯嘉美. 华中师范大学学报(自然科学版). 2018(03)
[4]基于多通道卷积神经网络的中文微博情感分析[J]. 陈珂,梁斌,柯文德,许波,曾国超. 计算机研究与发展. 2018(05)
[5]基于卷积记忆神经网络的微博短文本情感分析[J]. 郑啸,王义真,袁志祥,秦锋. 电子测量与仪器学报. 2018(03)
[6]使用深度长短时记忆模型对于评价词和评价对象的联合抽取[J]. 沈亚田,黄萱菁,曹均阔. 中文信息学报. 2018(02)
[7]基于条件随机场的评价对象抽取[J]. 夏圆,张征. 计算机系统应用. 2017(11)
[8]基于LSTM网络的评价对象和评价词抽取[J]. 李盛秋,赵妍妍,秦兵,刘挺. 智能计算机与应用. 2017(05)
[9]基于半监督CRF的跨领域中文分词[J]. 邓丽萍,罗智勇. 中文信息学报. 2017(04)
[10]基于句法结构的评价对象抽取方法研究[J]. 杨云. 长春教育学院学报. 2017(06)
硕士论文
[1]基于词嵌入的个性化推荐系统的研究[D]. 孟天宏.河北科技大学 2018
[2]网购用户评论中隐式评价对象的提取方法研究[D]. 马京苗.北京交通大学 2017
[3]产品评论中隐式评价对象的抽取研究[D]. 曾令伟.上海交通大学 2014
本文编号:3368580
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3368580.html
最近更新
教材专著