旅游领域属性抽取方法的研究

发布时间:2024-02-25 22:44
  随着计算机应用技术的发展与人工智能技术的兴起,如何快速且高效的从日益剧增的互联网数据中获取有价值的数据,是当前自然语言处理领域的重要研究问题。属性抽取(Attribute Extraction),即实体的属性值抽取,是从非结构化文本等数据源中自动抽取出实体的相关属性值,是问答系统(Question Answer ing System,QA)、信息抽取(Information Extraction)、知识图谱(Knowledge Gra ph,KG)等自然语言处理任务(Nature Language Process,NLP)的基础。本文研究旅游领域的实体属性抽取方法,以双向长短时记忆网络-条件随机场(Bidirectional Long Short-term Memory-Conditional Random Fields,BLSTM-CRF)模型为基础,提出一种新的融合残差卷积神经网络与自注意力机制的属性抽取方法。过去有关属性抽取的工作多是基于封闭世界假说(Closed World Assumption)的条件下,或是引入词典,或是引入人工特征。但是这种方法只能发现已有的属性,不能够发...

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

图1本文方法原理框架图Fig.1Frameworkoftheproposedmethod

图1本文方法原理框架图Fig.1Frameworkoftheproposedmethod

.针对负例数据中存在可以作为正例数据的上下位关系文本,采用关键词模式匹配,二次获取负例数据中的正例数据,使正例数据得到极大丰富.最后使用各个关系下的正例数据和少量负例数据组合成的训练语料,提取训练语料的词性特征、依存关系特征和短语句法树特征,使3种特征融合为一个语义信息更丰富的大....


图2.2无监督学习属性抽取流程图Figure2.2Flowchartofunsupervisedlearningattributeextraction

图2.2无监督学习属性抽取流程图Figure2.2Flowchartofunsupervisedlearningattributeextraction

内蒙古大学硕士学术论文9∑[1(+)]+||||2=1(2-3)2.2.2无监督的属性抽取在现实生活中,常常由于缺乏足够的先验知识,难以对样本数据进行人工标注或进行标注所花费的代价太高。为了解决这一类问题,研究人员提出了不需要标记样本的无监督学习方法。当前无监督学习主要分为两种,....


图2.4LSTM结构图Figure2.4thearchitectureofLSTM

图2.4LSTM结构图Figure2.4thearchitectureofLSTM

旅游领域属性抽取方法的研究12并把它作为当前时刻神经元的输入[24]。与传统神经网络相比,RNN隐藏层中的神经元不是无连接的,而是有连接的。RNN通过基于时间的反向传播算法(Back-propagationThroughTime,BPTT)反向传播误差,BPTT的基础是反向传播算....


图3.1Skip-gram和CBOW结构图Figure3.1thearchitectureofSkip-gramandCBOWGlove是JeffreyPennington等人在2014年提出来的[31]

图3.1Skip-gram和CBOW结构图Figure3.1thearchitectureofSkip-gramandCBOWGlove是JeffreyPennington等人在2014年提出来的[31]

内蒙古大学硕士学术论文15图3.1Skip-gram和CBOW结构图Figure3.1thearchitectureofSkip-gramandCBOWGlove是JeffreyPennington等人在2014年提出来的[31]。当时的词嵌入主要分为两种,一种是基于窗口的方法(....



本文编号:3910956

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3910956.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c3183***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com