基于命名实体识别的手机领域知识库问答系统
发布时间:2021-07-10 14:25
随着信息产业的发展,手机普及到我们的生活之中。智能手机种类繁多,功能多样,使得用户在售前和售后过程中都会遇到许许多多的问题。企业一般通过设置客服系统结合人工客服来解决此类问题,这给企业带来了巨大的成本压力。传统的客服系统只能提供预设好的问题供用户选择,无法很好的解决用户的问题,此时就需要有一个可以真正理解用户的问答系统来缓解此类问题。知识库问答是指给定一段自然语言提问,利用多种方式语义分析,利用知识库进行查询推理从而得出答案的一种问答系统。近年来,虽然知识库问答领域已经取得了长足的发展,但是目前业界尚未研发出一套成熟的手机领域的问答系统。本文围绕着手机领域,以命名实体识别为核心,设计并实现了一个知识库问答系统。本文的主要工作有以下三个方面:第一,完成了手机领域的知识库构建:本文使用基于语法分析与句法分析的方法,结合一些外部数据,实现了手机领域相关实体的抽取,主要包含手机属性类实体,手机功能类实体,手机故障类实体,以及手机名称实体几大类。并将其存储到了基于Hbase的实体库之中。第二,实现了手机领域命名实体识别服务系统:使用Bi-LSTM+CRF模型,结合挖掘到的实体库进行语料回标,实现...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:90 页
【学位级别】:硕士
【部分图文】:
图3-1本项目的用例图??Figure?3-1?Use?Case?Diagram?of?the?Project??
联网中获取最新数据,经过实体抽取功能抽取出文本中包含的实体,将抽取到的实??体经过组织整理,再建立索引以后,最后将存储到知识库之中。此功能的IPO图??如图3-2所示。??输入?处理?输出??原始网页?j?1.?数据爬取?j原始网页数据??2.?数据预处理?纯文本数据??3.?实体抽取?实体??4.?数据格式化及存储?实体库??图3-2知识库构建功能IPO图??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO图中处理流程的需求描述如下:??(1)定期网页数据获取??网页数据总是具有一定的时效性,例如手机产品每隔一段时间就会有所更新,??因此数据需要定期从网络中获取,本文获取的数据主要用于解决系统需求。手机的??产品型号名称等信息从中关村在线网站获取。中关村在线囊括了几乎市面上全部??手机、并且参数也较为详细。功能和故障从某品牌的服务与支持系统、以及说明书??资料获取,由于该服务与支持系统包含了用户大量的提问与解决步骤。此外一些手??机论坛、评测网站也作为数据的重要来源。这些数据获取下来以后需要以原始网页??文本文件的形式分类进行存储。?'??12??
联网中获取最新数据,经过实体抽取功能抽取出文本中包含的实体,将抽取到的实??体经过组织整理,再建立索引以后,最后将存储到知识库之中。此功能的IPO图??如图3-2所示。??输入?处理?输出??原始网页?j?1.?数据爬取?j原始网页数据??2.?数据预处理?纯文本数据??3.?实体抽取?实体??4.?数据格式化及存储?实体库??图3-2知识库构建功能IPO图??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO图中处理流程的需求描述如下:??(1)定期网页数据获取??网页数据总是具有一定的时效性,例如手机产品每隔一段时间就会有所更新,??因此数据需要定期从网络中获取,本文获取的数据主要用于解决系统需求。手机的??产品型号名称等信息从中关村在线网站获取。中关村在线囊括了几乎市面上全部??手机、并且参数也较为详细。功能和故障从某品牌的服务与支持系统、以及说明书??资料获取,由于该服务与支持系统包含了用户大量的提问与解决步骤。此外一些手??机论坛、评测网站也作为数据的重要来源。这些数据获取下来以后需要以原始网页??文本文件的形式分类进行存储。?'??12??
【参考文献】:
期刊论文
[1]基于表示学习的知识库问答研究进展与展望[J]. 刘康,张元哲,纪国良,来斯惟,赵军. 自动化学报. 2016(06)
本文编号:3276084
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:90 页
【学位级别】:硕士
【部分图文】:
图3-1本项目的用例图??Figure?3-1?Use?Case?Diagram?of?the?Project??
联网中获取最新数据,经过实体抽取功能抽取出文本中包含的实体,将抽取到的实??体经过组织整理,再建立索引以后,最后将存储到知识库之中。此功能的IPO图??如图3-2所示。??输入?处理?输出??原始网页?j?1.?数据爬取?j原始网页数据??2.?数据预处理?纯文本数据??3.?实体抽取?实体??4.?数据格式化及存储?实体库??图3-2知识库构建功能IPO图??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO图中处理流程的需求描述如下:??(1)定期网页数据获取??网页数据总是具有一定的时效性,例如手机产品每隔一段时间就会有所更新,??因此数据需要定期从网络中获取,本文获取的数据主要用于解决系统需求。手机的??产品型号名称等信息从中关村在线网站获取。中关村在线囊括了几乎市面上全部??手机、并且参数也较为详细。功能和故障从某品牌的服务与支持系统、以及说明书??资料获取,由于该服务与支持系统包含了用户大量的提问与解决步骤。此外一些手??机论坛、评测网站也作为数据的重要来源。这些数据获取下来以后需要以原始网页??文本文件的形式分类进行存储。?'??12??
联网中获取最新数据,经过实体抽取功能抽取出文本中包含的实体,将抽取到的实??体经过组织整理,再建立索引以后,最后将存储到知识库之中。此功能的IPO图??如图3-2所示。??输入?处理?输出??原始网页?j?1.?数据爬取?j原始网页数据??2.?数据预处理?纯文本数据??3.?实体抽取?实体??4.?数据格式化及存储?实体库??图3-2知识库构建功能IPO图??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO图中处理流程的需求描述如下:??(1)定期网页数据获取??网页数据总是具有一定的时效性,例如手机产品每隔一段时间就会有所更新,??因此数据需要定期从网络中获取,本文获取的数据主要用于解决系统需求。手机的??产品型号名称等信息从中关村在线网站获取。中关村在线囊括了几乎市面上全部??手机、并且参数也较为详细。功能和故障从某品牌的服务与支持系统、以及说明书??资料获取,由于该服务与支持系统包含了用户大量的提问与解决步骤。此外一些手??机论坛、评测网站也作为数据的重要来源。这些数据获取下来以后需要以原始网页??文本文件的形式分类进行存储。?'??12??
【参考文献】:
期刊论文
[1]基于表示学习的知识库问答研究进展与展望[J]. 刘康,张元哲,纪国良,来斯惟,赵军. 自动化学报. 2016(06)
本文编号:3276084
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3276084.html