当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于阅读理解技术的问答系统设计与实现

发布时间:2020-05-31 07:48
【摘要】:面对互联网上海量的信息,人们越来越依靠搜索引擎获取信息。传统的搜索引擎检索返回与用户查询相关的网页,用户需要花费大量时间和精力从中获取所需信息。区别于传统的搜索引擎,检索式问答系统通过信息检索技术获取相关文档,利用问答算法从相关文档中抽取答案,其能够为用户提供简短和准确的结果。传统的检索式问答系统采用基于流水线方式的问答算法,该类问答算法只能捕捉输入信息中的浅层语义关联,且存在着优化成本高和优化难度大等问题。考虑到目前端到端的阅读理解模型训练简便、优化效果直观且能够捕捉输入信息的深层语义关联等优点,本文设计并实现了一个基于阅读理解技术的问答系统。对于本文设计并实现的问答系统,其包含Web服务模块、信息检索模块、中文预处理模块、答案预测模块和日志与存储模块五个模块。其中,答案预测模块的问答算法基于阅读理解模型实现。特别地,针对目前阅读理解模型难以满足检索式问答系统对问答算法计算效率的要求,且不能处理相关文档中答案数量不固定的情况,本文设计了一个面向检索式问答系统的阅读理解模型(Reading Comprehension model for Retrieval-based Question Answering System,RQA-RC)。RQA-RC模型由问题编码结构、文档编码结构、注意力机制和预测结构组成。考虑到检索式问答系统注重问答算法的计算效率和该问答场景中问答数据的特点,本文设计并结合了基于双向长短期记忆网络的问题编码结构和基于卷积神经网络的文档编码结构,使得模型在保持良好文本编码效果的前提下显著提升了计算效率。考虑到该问答场景中相关文档的答案数量不固定,本文设计了一个基于序列标注的预测结构并提出了一种参考Focal Loss思想的损失函数,使得模型能够有效地处理相关文档中任意数量的答案。实验结果表明,在面向检索式问答系统的问答任务中,RQA-RC模型相比现有的阅读理解模型,其在计算效率和F1值上具有明显的提升。通过系统测试,本文自主设计和实现的问答系统各功能模块均符合预期,系统非功能指标符合应用要求。
【图文】:

示意图,语义分析,向量,年代


同时,随着词库中词数量的增长,词向量将变得非常稀疏和巨大。不妨假逡逑设词库中一共存在N个词,那么?{汽车,轿车,,苹果,河流,太阳丨五个词此时的逡逑one-hot向量如图2-1所示。逡逑位置0邋兔1邋i2邋i3邋i4邋i5邋N逡逑词语邋厂逦逦逦逦逦J逡逑|逦轿车逦I逦:逡逑:苹果逦¥逦丨逦CL.CL.0...1...0...0...0逦i邋r逡逑!河流【逦丨逦…i逡逑?大阳逦:逦0逦0邋“邋?邋04邋*?邋0邋**?邋0逦“邋0逦_逡逑;v逦数据逦」逡逑图2-】one-hot向量示意图逡逑为解决该问题,从上个世纪90年代开始,隐含语义分析(Latent邋Semantic逡逑Analysis,邋LSA)[9]和主题模型(Latent邋Dirichlet邋Allocation,LDA)[U]相继被提出。这些逡逑模型通过生成稠密的实数向量作为词向量,这些低维稠密的词向量解决了邋one-逡逑hot邋词向量中邋“词汇鸿沟”邋和维度爆炸等问题。邋2003邋年,邋Bengio邋利用神经网络训逡逑练词向量,并首次将神经网络的网络参数和词向量一起训练[121。2013年,Mikolov逡逑7逡逑

示意图,结构示意图,自然语言处理,北京邮电大学


北京邮电大学工学硕士学位论文出了一种词向量的计算方式word2vec。其中,word2vec较的效果使得词向量逐渐进入实用化阶段,以下将详细地介绍word2veC被广泛地应用于自然语言处理任务中,例如智能问答、要(Automatic邋Summarization)等领域。word2vec训练时依据邋CBOW(Continuous邋Bag-of-Words,邋C.BOW)和邋Skip-gi_am(Continkip-gram)两种模型。给定训练语料[WpW^w;^...,wN],对于c需要指定上下文窗口的大小Window_size。假设Window_size窗口内的词分别有wt_2、Wty、wt+1和wt+2。基于如上信息,Cm的模型结构示意图如图2-2和图2-3所示。逡逑
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 任梦婷;王娟;阮佩姗;刘振盼;;影响高质量网络问答系统建设的因素[J];物流科技;2016年12期

2 武振国;李艳翠;;植物病虫害智能问答系统设计与实现[J];农业网络信息;2017年01期

3 费建军;;智能问答系统中命名实体识别问题研究[J];数字技术与应用;2017年07期

4 何秀;;智能问答系统的研究与设计[J];南方农机;2017年20期

5 张中峰;李秋丹;;社区问答系统研究综述[J];计算机科学;2010年11期

6 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期

7 张积宾;徐志明;王恒;潘启树;;面向大规模网络数据的社会化问答系统[J];哈尔滨工业大学学报;2008年12期

8 胡婕;陶宏才;;基于深度学习的领域问答系统的设计与实现[J];成都信息工程大学学报;2019年03期

9 徐雄;;基于深度学习的问答系统研究[J];湖北师范大学学报(自然科学版);2019年01期

10 吴灵慧;;问答系统研究综述[J];科技传播;2019年05期

相关会议论文 前10条

1 何靖;陈

本文编号:2689532


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2689532.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户378c3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com