基于语义理解的智能问答系统关键技术研究
发布时间:2021-11-09 05:31
大数据、人工智能等技术的蓬勃发展使得网络数据规模急剧增长,传统搜索引擎根据用户输入的关键字返回相关网页链接的无序列表,检索结果包含大量无关冗余信息,无法满足当前用户的需求。智能问答系统综合自然语言处理、知识管理等技术理解用户查询意图,将精确答案以自然语言形式返回用户。然而现有问答系统大多采用大型语料库作为知识源,数据冗余且维度单一,同时受同义词、多义词的影响,用户问句不能清晰反映其查询意图,这造成了系统检索术语错配、返回出错等情况。语义Web技术的快速发展给以上问题提供了良好的解决思路,越来越多的研究者尝试将语义Web中的关键技术如本体构建、语义查询等应用于问答系统,以解决问答系统缺乏语义理解的问题。本文将语义Web技术与问答系统相结合,使用本体作为问答系统的知识源,在语义和知识层次上描述信息,增加了语义理解和知识推理,解决传统问答系统中问句匹配度差、用户查询意图模糊的问题,旨在优化智能问答系统的语义理解能力,提供准确、全面的问答服务。本文创新工作如下:(1)多特征融合的句子语义相似度计算。在句子相似度计算中综合考虑句子的结构信息与语义信息,提取句子词形特征、词序特征及句长特征,使用层...
【文章来源】:西安邮电大学陕西省
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图书领域本体片段4.3.2实验设计与分析
西安邮电大学硕士学位论文本文问答系统架构的设计,搜集大量图书领域基本词社类别及名称、作者编者及名称等。、属性书领域词汇进行去停、抽象、删重等格式化操作,定,定义四个一级类图书(Book)、出版社(Publisher)之后在一级类下划分二级子类。依据《中国图书馆分(Biography)、儿童文学(Literature for Children)、y)、小说(Fiction)等子类;人员类包含作者(Author 中作 者又分为中国 籍作 者( Chinese_Author )or);出版社类中定义七个子类,时间类中定义两个子体以 Thing 为大类被划分成了四层结构,分别为 等,此处给出 Thing 和 Book 之间的 is-a 关系类图如
第 5 章 智能问答原型系统在定义好图书领域类名之后需要定义各类的数据属性和对象属性。在图书领域本体中针对四个大类间互相存在的关系定义了 20 多个属性,包含图书与出版社、作者、读者、时间之间的互相关系,如出版(hasPublish)、撰写(hasWritten)、付稿费(payMoneyTo)、出版时间(isPublishedIn)、借阅时间(isBorrowedBy)、归还时间(isReturnedBy)、被出版(isPublishedBy)等,每个属性都分别定义其定义域和值域,如 hasPublish 属性的定义域是 Publisher,值域是 Book,如图 5.3 所示。
【参考文献】:
期刊论文
[1]文本相似度计算方法研究综述[J]. 王春柳,杨永辉,邓霏,赖辉源. 情报科学. 2019(03)
[2]基于知识库的开放领域问答系统[J]. 张涛,贾真,李天瑞,黄雁勇. 智能系统学报. 2018(04)
[3]基于多特征融合的句子相似度计算方法[J]. 黄姝婧,张仰森. 北京信息科技大学学报(自然科学版). 2017(05)
[4]基于TFIDF的社区问答系统问句相似度改进算法[J]. 赵胜辉,李吉月,徐碧,孙博研. 北京理工大学学报. 2017(09)
[5]面向知识自动化的自动问答研究进展[J]. 曾帅,王帅,袁勇,倪晓春,欧阳永基. 自动化学报. 2017(09)
[6]文本相似度计算方法研究综述[J]. 陈二静,姜恩波. 数据分析与知识发现. 2017(06)
[7]基于Web的问答系统综述[J]. 李舟军,李水华. 计算机科学. 2017(06)
[8]从文本中构建领域本体技术综述[J]. 任飞亮,沈继坤,孙宾宾,朱靖波. 计算机学报. 2019(03)
[9]基于词汇语义信息的文本相似度计算[J]. 谷重阳,徐浩煜,周晗,张俊杰. 计算机应用研究. 2018(02)
[10]基于语义依存的汉语句子相似度改进算法[J]. 黄洪,陈德锐. 浙江工业大学学报. 2017(01)
硕士论文
[1]面向网络的中文问答系统相关技术的研究与系统初步实现[D]. 谭伟.清华大学 2005
本文编号:3484723
【文章来源】:西安邮电大学陕西省
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图书领域本体片段4.3.2实验设计与分析
西安邮电大学硕士学位论文本文问答系统架构的设计,搜集大量图书领域基本词社类别及名称、作者编者及名称等。、属性书领域词汇进行去停、抽象、删重等格式化操作,定,定义四个一级类图书(Book)、出版社(Publisher)之后在一级类下划分二级子类。依据《中国图书馆分(Biography)、儿童文学(Literature for Children)、y)、小说(Fiction)等子类;人员类包含作者(Author 中作 者又分为中国 籍作 者( Chinese_Author )or);出版社类中定义七个子类,时间类中定义两个子体以 Thing 为大类被划分成了四层结构,分别为 等,此处给出 Thing 和 Book 之间的 is-a 关系类图如
第 5 章 智能问答原型系统在定义好图书领域类名之后需要定义各类的数据属性和对象属性。在图书领域本体中针对四个大类间互相存在的关系定义了 20 多个属性,包含图书与出版社、作者、读者、时间之间的互相关系,如出版(hasPublish)、撰写(hasWritten)、付稿费(payMoneyTo)、出版时间(isPublishedIn)、借阅时间(isBorrowedBy)、归还时间(isReturnedBy)、被出版(isPublishedBy)等,每个属性都分别定义其定义域和值域,如 hasPublish 属性的定义域是 Publisher,值域是 Book,如图 5.3 所示。
【参考文献】:
期刊论文
[1]文本相似度计算方法研究综述[J]. 王春柳,杨永辉,邓霏,赖辉源. 情报科学. 2019(03)
[2]基于知识库的开放领域问答系统[J]. 张涛,贾真,李天瑞,黄雁勇. 智能系统学报. 2018(04)
[3]基于多特征融合的句子相似度计算方法[J]. 黄姝婧,张仰森. 北京信息科技大学学报(自然科学版). 2017(05)
[4]基于TFIDF的社区问答系统问句相似度改进算法[J]. 赵胜辉,李吉月,徐碧,孙博研. 北京理工大学学报. 2017(09)
[5]面向知识自动化的自动问答研究进展[J]. 曾帅,王帅,袁勇,倪晓春,欧阳永基. 自动化学报. 2017(09)
[6]文本相似度计算方法研究综述[J]. 陈二静,姜恩波. 数据分析与知识发现. 2017(06)
[7]基于Web的问答系统综述[J]. 李舟军,李水华. 计算机科学. 2017(06)
[8]从文本中构建领域本体技术综述[J]. 任飞亮,沈继坤,孙宾宾,朱靖波. 计算机学报. 2019(03)
[9]基于词汇语义信息的文本相似度计算[J]. 谷重阳,徐浩煜,周晗,张俊杰. 计算机应用研究. 2018(02)
[10]基于语义依存的汉语句子相似度改进算法[J]. 黄洪,陈德锐. 浙江工业大学学报. 2017(01)
硕士论文
[1]面向网络的中文问答系统相关技术的研究与系统初步实现[D]. 谭伟.清华大学 2005
本文编号:3484723
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3484723.html