基于序列标注的汽车产品对象抽取方法研究

发布时间:2021-09-04 05:44
  面向汽车的产品评论是指用户在微博、论坛、微信公众号等平台发表自己对汽车的价格、性能、动力、外观等方面的主观使用感受。在汽车评论中,用户评论产品时经常带有明确的指向,往往针对特定产品的某一部分或某一功能做出具体评价。因此,挖掘汽车产品评论中的汽车名称及属性,对于汽车厂商和消费者具有重要的商业价值。本文将汽车名称和属性统称为产品对象,这样,抽取评论中的产品对象也是产品评论分析的基本任务,更是细粒度情感分析的重要研究问题。已有的研究多是针对评价产品名称进行单独抽取,并没有考虑产品的名称和属性。本文针对汽车评论中产品对象的抽取问题,以实现产品评论细粒度情感分析为目标,开展汽车的产品名称和产品属性的抽取方法研究。本文的主要工作有以下三点:(1)相关技术和数据标注规范对中文文本表示基础理论以及汽车产品名称与属性抽取相关技术进行了分析,并对数据标注规范进行了介绍。首先对中文文本表示相关方法Word2vec模型和Cw2vec模型进行了介绍。通过分析评论数据的特点,制定相应的数据标注规范,为实验数据的标注提供了标准。(2)融合多特征的产品对象抽取方法将产品对象的抽取看作是一个序列标注问题,提出一种基于词... 

【文章来源】:山西大学山西省

【文章页数】:50 页

【学位级别】:硕士

【部分图文】:

基于序列标注的汽车产品对象抽取方法研究


“宝马车型好看”cw2vec示例

示意图,网络结构,示意图,产品


第四章基于cw2vec-BiLSTM-CRF的产品名称和属性识别方法21也称为双向LSTM[47]即BiLSTM。对于词tx可得到[;]ttthhh。在BiLSTM模型中softmax层的输出是相互独立的,即BiLSTM可以学习上下文的信息,但是并没有标签依赖关系,有可能导致像序列标签产品名称B-na与产品属性I-at连续出现的语法错误。而CRF模型中包含了特征之间的转移概率,使得输出标签之间存在顺序关系。因此,采用CRF模型作为识别产品名称和产品属性的BiLSTM模型的输出层。4.1.2基于cw2vec-BiLSTM-CRF的产品名称和属性识别算法为了同时抽取评论文本中的产品名称和产品属性,本文利用cw2vec进行词向量表示的基础上,再结合BiLSTM和CRF两种模型进行抽取,其网络结构示意图如图4.1所示。图4.1Bi-LSTM-CRF网络结构示意图整个抽取过程如下:(1)使用了BIO标注法来对汽车领域产品评论语料进行标注,标注格式见表4.1所示。表4.1句子序列标注格式句子一汽丰田花冠不可不畏经典车型标注B-naI-naI-naOOOB-at(2)利用cw2vec模型[48],结合sougoCA语料进行词向量的预训练。在训练过程中,使用jieba分词将句子分成词序列,并求得词向量作为模型的输入。利用BiLSTM的输出th和th进行相加输入到Liner层和log-softmax层,通过非线性操作

【参考文献】:
期刊论文
[1]基于word2vec和双向LSTM的情感分类深度模型[J]. 黄贤英,刘广峰,刘小洋,阳安志.  计算机应用研究. 2019(12)
[2]基于CRF和Bi-LSTM的保险名称实体识别[J]. 陈彦妤,杜明.  智能计算机与应用. 2018(03)
[3]使用深度长短时记忆模型对于评价词和评价对象的联合抽取[J]. 沈亚田,黄萱菁,曹均阔.  中文信息学报. 2018(02)
[4]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯.  中文信息学报. 2018(01)
[5]基于LSTM网络的评价对象和评价词抽取[J]. 李盛秋,赵妍妍,秦兵,刘挺.  智能计算机与应用. 2017(05)
[6]基于条件随机场的评价对象缺省项识别[J]. 唐文武,过弋,徐永斌,方旭.  中文信息学报. 2016(06)
[7]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼.  计算机学报. 2017(03)
[8]基于多特征融合的中文微博评价对象抽取方法[J]. 李景玉,张仰森,蒋玉茹.  计算机应用研究. 2016(02)
[9]基于层叠CRFs的中文句子评价对象抽取[J]. 郑敏洁,雷志城,廖祥文,陈国龙.  中文信息学报. 2013(03)
[10]基于条件随机场方法的开放领域新词发现[J]. 陈飞,刘奕群,魏超,张云亮,张敏,马少平.  软件学报. 2013(05)

硕士论文
[1]基于法律的知识图谱构建[D]. 邹爱玲.电子科技大学 2019
[2]司法文书法律要素提取方法的研究与实现[D]. 王林木.东南大学 2018
[3]面向法律文书的中文命名实体识别方法研究[D]. 王礼敏.苏州大学 2018
[4]面向中文法律文本的命名实体识别研究[D]. 谢云.南京师范大学 2018
[5]基于隐式马尔科夫模型的法律命名实体识别模型的设计与应用[D]. 周晓辉.华南理工大学 2017
[6]基于领域知识的评价对象抽取研究[D]. 杨森.北京理工大学 2015
[7]在线评论的产品属性提取与情感分析研究[D]. 冯小翼.华中科技大学 2011
[8]评价对象抽取研究[D]. 鞠久朋.苏州大学 2011



本文编号:3382678

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3382678.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eb1ee***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com