基于领域本体与句型模板的问答系统
本文选题:远程教育 + 问答系统 ; 参考:《广西师范大学》2012年硕士论文
【摘要】:随着计算机技术与因特网的迅速发展,人们愈来愈多的借助搜索引擎来查询网络上的各种信息,然而搜索引擎存在很多弊端,首先,它返回给用户大量相关和无关的网页,用户需要从这些网页中进一步的筛选信息;其次,几个关键字的组合很难清楚的表达用户检索意图,同时,基于关键字的索引,匹配算法不涉及语义,很难提高检索的效果。因此,探索更人性化、更高效的搜索引擎具有十分重要的意义。而问答系统是集知识表示、信息检索和自然语言处理为一体的,能更好的满足用户的检索需求,已经成为新的研究热点。 另一方面,网络技术的发展使远程教育被越来越多的人接受,远程教学突出的特点是时空的分离,教师与学生之间缺乏有效的沟通。智能问答系统结合自然语言处理技术能对用户自然语言形式的提问进行理解,并给出简洁、明确的回答,能够很好的解决远程教学中学生的答疑问题。 目前,基于自然语言理解的中文问答系统很少而且准确率都不高,主要困难在于知识库的构建和计算机对用户问句的语义理解。本文研究的问答系统是基于本体知识库和句型模板的。首先,论文以本体技术为基础构建了领域本体知识库,在本体构建中利用Tbox中已有的概念和关系定义了抽象概念,抽象概念的定义克服了对复杂概念进行表示的困难,能满足用户对概念定义与特征的提问;其次,论文选用基于语义块的句型模板匹配方法,在句型模板的定义时,新增了同义语义模板,定义了主题语义块、特征语义块、疑问语义块、辅助语义块,并制定了用户问句的语义块识别规则,提出了句型模板相似度计算方法;然后,设计了基于本知识库和句型模板的问答系统模型,该模型在问句理解、本体知识库等方面进行了改进,在很大程度上提高了问答系统的准确率;最后利用该模型实现了面向《大学计算机基础》的问答系统。 论文主要做了以下几个方面的工作: 一、系统阐述问答系统基础知识。分析了问答系统的国内外的研究现状,以及问答系统的内涵、研究的主要内容,并探讨了中文自动问答系统研究的难点。根据本论文的研究方向,着重介绍了本体和领域知识库的主要内容,以及相关的汉语语言处理技术,包括现有的分词算法和问句理解方法等。 二、构建基于本体的知识库。本体知识库有利于知识的组织、管理、维护以及实现语义查询和推理。论文在本体构建方面的最大特点是定义了基于特殊关系的抽象概念,抽象概念是利用Tbox中已有的概念和关系进行定义的,它能清晰的表达复杂概念,更好的满足了用户的提问。论文中介绍了常用的本体构建方法,通过比较这些方法的特点,我们选择知识工程方法构建了《大学计算机基础》领域本体知识库。 三、理解用户问句语义。本论文采用基于语义块句型模板匹配方法,在定义句型模板的结构时,新增了同义语义模板,定义了主题语义块、特征语义块、疑问语义块、辅助语义块,其中只有主题语义块和特征语义块对用户问句的语义特征有影响,结合论文语义块的定义的特点,制定了语义块识别规则。在用户问句模板与句型模板库中模板匹配时,提出了模板相似度计算,在很大程度上提高了提取用户问句语义特征的成功率,放宽了匹配尺度,尽可能的回答用户的提问。 四、基于本体知识库和句型模板的问答系统的设计与实现。本文设计的问答系统模型,在问句理解、本体知识库等方面进行了改进,系统是由前台的自然语言界面和后台的领域本体知识库构成。自然语言理解界面主要是获取用户的问句,并采用我们基于语义块的句型模板匹配算法获取用户提问的语义;对后台领域本体知识库的主要操作是查询和推理,获得了问句的准确语义后,根据不同的语义信息采用相应的查询形式对本体知识库进行查询与推理,将查询到的结果重新组织,并返回给用户。最后利用该模型实现了面向《大学计算机基础》的问答系统,该系统不仅能对实例进行查询,还能回答对概念定义与特征的提问,可以很好的应用于教学领域,实现对学生问题的答疑。
[Abstract]:With the rapid development of computer technology and Internet , people increasingly use search engines to query various kinds of information on the network . However , the search engine has many disadvantages . First , it returns to users a large number of relevant and unrelated web pages , and users need further screening information from these pages ;
Secondly , it is very difficult to express the user ' s intent to express the user ' s intention . At the same time , it is very difficult to improve the retrieval effect based on the keyword - based index and the matching algorithm . Therefore , it is very important to explore the more humanized and more efficient search engine .
On the other hand , the development of the network technology has made the distance education more and more accepted , the remote teaching is characterized by the separation of time and space , and the lack of effective communication between teachers and students . The intelligent question and answer system combines the natural language processing technology to understand the question of the form of the user ' s natural language .
At present , the Chinese question and answer system based on natural language understanding is little and the accuracy rate is not high , the main difficulty lies in the construction of the knowledge base and the semantic understanding of the user question sentence . The question and answer system of this paper is based on ontology knowledge base and sentence template . Firstly , this paper constructs the domain ontology knowledge base on the basis of ontology technology .
Secondly , the thesis selects a sentence pattern matching method based on semantic block . When the sentence template is defined , a synonym template is added to define the semantic block , the feature semantic block , the question semantic block , the auxiliary semantic block and the semantic block recognition rule of the user question sentence , and the similarity calculation method of the sentence template is proposed .
Then , a question - and - answer system model based on this knowledge base and sentence template is designed . The model improves the question sentence understanding , ontology knowledge base and so on , and improves the accuracy of the question - and - answer system to a great extent ;
Finally , we use the model to realize the question - and - answer system of the computer - based curriculum of the university .
The thesis mainly focuses on the following aspects :
Firstly , the system expounds the basic knowledge of the question and answer system , analyzes the research situation of the question and answer system at home and abroad , and the connotation of the question and answer system , and discusses the difficulties in the research of the Chinese automatic question answering system . According to the research direction of this paper , the main contents of the ontology and the domain knowledge base and the related Chinese language processing techniques are emphatically introduced , including the existing word segmentation algorithm and the question sentence understanding method .
Second , the ontology - based knowledge base is constructed . The ontology knowledge base is beneficial to the organization , management , maintenance of knowledge and the realization of semantic query and reasoning .
The thesis adopts semantic block - based template matching method . When defining the structure of the sentence pattern template , the semantic block recognition rules are defined . Only the subject semantic block and the characteristic semantic block have an influence on the semantic features of the user ' s question sentence .
4 . The design and implementation of a question and answer system based on ontology knowledge base and sentence template . A question and answer system model is designed in this paper . It is composed of natural language interface of foreground and ontology knowledge base in the background .
The main operation of ontology knowledge base in the background field is querying and reasoning , obtaining the exact semantics of the question sentence , querying and reasoning the ontology knowledge base according to different semantic information , re - organizing the inquired result and returning to the user .
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.1
【参考文献】
相关期刊论文 前10条
1 李季,迟呈英;中文问答系统的研究[J];鞍山科技大学学报;2003年06期
2 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
3 樊孝忠,李宏乔,李良富,叶江;银行领域汉语自动问答系统BAQS的研究与实现[J];北京理工大学学报;2004年06期
4 索东梅;自然语言理解研究[J];长春师范学院学报;2005年02期
5 刘亚军,徐易;一种基于加权语义相似度模型的自动问答系统[J];东南大学学报(自然科学版);2004年05期
6 王树西,刘群,白硕;一个人物关系问答的专家系统[J];广西师范大学学报(自然科学版);2003年01期
7 刘杰;樊孝忠;王涛;;基于本体的受限领域问答系统研究[J];广西师范大学学报(自然科学版);2009年01期
8 刘汉兴;刘财兴;林旭东;;基于问句相似度的本体问答系统[J];广西师范大学学报(自然科学版);2010年01期
9 刘磊;郭丽;白宇;蔡东风;;问答系统中复杂类问题的分析方法研究[J];沈阳航空工业学院学报;2009年03期
10 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
相关博士学位论文 前2条
1 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
2 李景;领域本体的构建方法与应用研究[D];中国农业科学院;2009年
相关硕士学位论文 前8条
1 陈玉;基于事实性问题中文问答系统的研究与实现[D];山西大学;2006年
2 张佳;基于ontology的领域知识库的构建与集成实现[D];贵州大学;2006年
3 刘小宇;基于语义理解的中文常问问答系统的研究[D];大连理工大学;2006年
4 刘宝艳;面向生物医学领域的问答系统的研究与实现[D];大连理工大学;2007年
5 朱婷;领域知识的理解与应答方法的研究[D];河北农业大学;2009年
6 肖创海;课程问答实时系统的设计与实现[D];北京邮电大学;2008年
7 伍丽媛;现代远程教育课程考试质量分析和评价的研究[D];中南大学;2008年
8 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
,本文编号:2028343
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2028343.html