当前位置:主页 > 科技论文 > 软件论文 >

基于Wikipedia的自动问答系统研究与实现

发布时间:2019-05-10 10:21
【摘要】:随着科技与互联网的迅猛发展,人类已经被海量的数字化信息包围。如何快捷地在海量数据中找到所需信息是需要迫切解决的问题。因此自动问答(QA)系统应运而生。QA系统可以直接接收用户提出的自然语言形式的问句,然后返回给用户简洁准确的答案。目前的QA系统存在以下两个问题:(1)基于关键词匹配的方法只考虑句中关键词频率,不考虑关键词的语义及关键词间的语义关系,返回的答案经常与用户问题无关;(2)不能根据用户对于答案的概念抽象层次的不同的需求提供不同的答案。本文设计并实现了一个基于Wikipedia的单文本自动问答系统(Automatic Question Answering Based on Single Document,简称SingleDoc系统)。Single Doc系统可以接受用户提出问题类型包括:“What is A”类型和“Who/When等疑问词+事件/事实”类型,A代表特定领域概念或术语。同时,Single Doc系统支持用户在输入问题的同时指定单篇论文及领域,然后从指定的论文中提取出满足问题所指的答案。该系统首先分析问题的类型,基于指定的单文本和领域关键词,通过DCSE(Domain Category Space Extraction)算法抽取Wikipedia中category及category间关系来构建领域分类空间(DCS),DCS描述了问题涉及的背景分类知识,然后在DCS中运用句子语义距离算法获取文本内容中的句子,将其作为系统答案输出。另一方面,该系统可以根据用户对于概念抽象层次的不同需求重新整理输出答案句子,提供个性化答案。本文主要工作有以下几点:(1)提出DCSE算法。该算法能够针对输入的领域关键词从Wikipedia中抽取相关category以及category之间语义关系构建相关领域分类空间。(2)基于抽取的领域分类空间,设计了SingleDoc系统的答案提取算法。通过实验表明,SingleDoc系统比关键词匹配的QA系统答案准确率高,并且在回答“What is A”类型问题准确率可以达到58%,在回答“When/Who/Where+事件/事实”类型准确率可以达到80%。(3)提出描述用户对于答案概念抽象层次的需求模型,从用户角度提供满足用户概念抽象层次需求的个性化答案。(4)设计并实现了基于Web的自动问答系统。该系统主要包含数据层、接口层、应用层和视图层,完成了领域分类空间构建和句子距离的计算,主要功能支持用户按照问题类型模板以自然语言句子输入问题、单篇文本和领域关键词,根据用户需求输出普通类型和不同概念抽象层次类型两种答案。
[Abstract]:......
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【参考文献】

相关期刊论文 前10条

1 杨建萍;年梅;;基于维基百科网络技术的概念语义网络构建[J];计算机与现代化;2016年01期

2 闫红;李付学;周云;;基于HowNet句子相似度的计算[J];计算机技术与发展;2015年11期

3 镇丽华;王小林;杨思春;;自动问答系统中问句分类研究综述[J];安徽工业大学学报(自然科学版);2015年01期

4 王正华;韩永国;;自动问答系统设计与实现[J];软件导刊;2014年09期

5 杨倩倩;徐栋;;TFIDF方法在英语句子相似度计算中的应用初探[J];电脑知识与技术;2012年17期

6 涂新辉;张红春;周琨峰;何婷婷;;中文维基百科的结构化信息抽取及词语相关度计算方法[J];中文信息学报;2012年03期

7 周永梅;陶红;陈姣姣;张再跃;;自动问答系统中的句子相似度算法的研究[J];计算机技术与发展;2012年05期

8 田卫东;祖永亮;;基于答案模式和语义特征融合的答案抽取方法[J];计算机工程与应用;2011年13期

9 刘汉兴;林旭东;田绪红;;基于本体的自动答疑系统的研究与实现[J];计算机应用;2010年02期

10 熊回香;夏立新;;自然语言处理技术在中文全文检索中的应用[J];情报理论与实践;2008年03期

相关硕士学位论文 前8条

1 陈丽莎;自动问答系统中基于WordNet的句子相似度计算研究与实现[D];华南理工大学;2014年

2 汪祥;基于中文维基百科的语义相关度计算的研究与实现[D];国防科学技术大学;2011年

3 王振佶;面向销售服务的自动问答系统的设计与实现[D];电子科技大学;2011年

4 马莉;基于动态本体知识库的问答系统的研究与实现[D];广西师范大学;2009年

5 邓昱;中文问答系统中的答案抽取算法研究[D];北京邮电大学;2009年

6 黄际洲;聊天机器人知识库自动抽取算法的研究与实现[D];重庆大学;2006年

7 王慧慧;基于自然语言处理的问答系统研究[D];电子科技大学;2006年

8 曹志娟;自动问答系统中的问题理解与信息检索研究[D];重庆大学;2005年



本文编号:2473573

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2473573.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9cc35***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com