当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于用户意图和句法角色的问句相似度计算研究

发布时间:2017-10-04 23:30

  本文关键词:基于用户意图和句法角色的问句相似度计算研究


  更多相关文章: FAQs问答系统 词语相似度 问句相似度 问句分类 语义相似度


【摘要】:随着信息化社会的发展,信息爆炸性的增长,搜索引擎技术的出现使人们能够快速的获取到信息。但是,传统的搜索引擎也存在其固有的缺陷,用户只能通过关键词进行检索,而关键词并不能充分表达用户的搜索意图,而且让用户从返回的大量包含关键词的结果中挑选可能的答案,难以给用户带来更好地体验。为了解决这些问题,,自动问答系统被提出。用户直接向问答系统提问,系统返回简单直接的答案,为用户节省了大量的时间,同时带来了更好的体验。 在基于常用问题库(FAQs)的自动问答系统中,问句的相似度计算是其最重要的一环,决定着整个问答系统效果的好坏,因此,本文重点对其进行了研究。论文的主要工作如下: (1)传统基于《知网》的词语相似度计算方法忽略了反义词间的关系,而这种处理方式会导致两个表达截然相反意思的问句具有很高的问句相似度。并且,基于《知网》的词语相似度计算方法,对语义词典依赖性很强,而对于层出不穷的网络新词和旧词新意问题则束手无策。为了解决这些问题,本文采用了一种考虑反义和对义关系的词语相似度计算方法,同时融合了基于统计的方法,解决这些问题。 (2)在传统的问答系统检索模型中,相似度是其考虑的核心因素,FAQ之间都是相互独立的,返回相似度最高的问句对应的答案给用户,此时,忽略了用户其他可能的意图,无法满足用户的多样性需求。因此,本文对问句匹配返回的结果进行意图分类,按照意图分组返回给用户,满足用户的多样性需求,同时又将其应用到问句相似度计算中,提高问句相似度计算的准确性。 (3)本文设计一种新的问句相似度计算方法,在基于词语语义特征的基础上,使用问句意图特征和句法角色特征,分别解决用户意图多样性和问句语义相似度高而问句表达意思不同的问题,提高了问句匹配的准确性,并且通过实验验证了该方法的有效性。 (4)基于以上相关研究,构建了一个基于FAQs的自动问答系统的原型,并对相关模块进行了改进,为今后的应用和进一步的研究提供了一个平台。
【关键词】:FAQs问答系统 词语相似度 问句相似度 问句分类 语义相似度
【学位授予单位】:青岛理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【目录】:
  • 摘要8-9
  • Abstract9-11
  • 第1章 绪论11-17
  • 1.1 研究的背景和意义11-12
  • 1.2 国内外研究现状12-14
  • 1.3 本文工作简介14-17
  • 1.3.1 本文研究内容14-15
  • 1.3.2 本文组织结构15-17
  • 第2章 相关技术简介17-31
  • 2.1 词语相似度计算方法17-22
  • 2.1.1 基于语义词典的方法17-20
  • 2.1.2 基于大规模语料统计的方法20-22
  • 2.1.3 两种方法比较22
  • 2.2 问句相似度计算方法22-27
  • 2.2.1 词语语义方法22-23
  • 2.2.2 词语重叠方法23-24
  • 2.2.3 向量空间方法24
  • 2.2.4 基于句法的方法24-27
  • 2.3 层次分类27-29
  • 2.3.1 全局分类方法27-28
  • 2.3.2 自上而下的分类方法28
  • 2.3.3 收缩分类方法28-29
  • 2.4 用户意图29-30
  • 2.5 本章小结30-31
  • 第3章 词语相似度计算31-36
  • 3.1 引言31
  • 3.2 词语相似度计算方法31-33
  • 3.3 实验结果及分析33-35
  • 3.4 本章小结35-36
  • 第4章 基于意图的问句分类36-41
  • 4.1 引言36
  • 4.2 用户意图36-39
  • 4.2.1 意图类别37-38
  • 4.2.2 分类方法38-39
  • 4.3 实验结果及分析39-40
  • 4.4 本章小结40-41
  • 第5章 基于意图和句法角色的问句相似度计算41-48
  • 5.1 引言41-42
  • 5.2 问句相似度方法42-45
  • 5.2.1 问句语义相似度42-43
  • 5.2.2 问句意图类型相似度43
  • 5.2.3 句法角色相似度43-44
  • 5.2.4 融合三种特征问句相似度方法44-45
  • 5.3 实验结果及分析45-47
  • 5.4 本章小结47-48
  • 第6章 自动问答系统原型48-61
  • 6.1 系统总体架构48-49
  • 6.2 系统流程49-50
  • 6.3 系统功能模块设计与实现50-55
  • 6.3.1 问答模块50-54
  • 6.3.2 知识库维护模块54-55
  • 6.4 数据库设计实现55-56
  • 6.5 Web Service 接口56-57
  • 6.6 系统展示57-60
  • 6.6.1 系统交互页面截图57
  • 6.6.2 系统寒暄演示57-58
  • 6.6.3 问答效果演示58-59
  • 6.6.4 系统维护模块59-60
  • 6.7 本章小结60-61
  • 第7章 总结与展望61-63
  • 参考文献63-66
  • 攻读硕士学位期间取得成果66-67
  • 致谢67

【相似文献】

中国期刊全文数据库 前10条

1 李伟;;中文语句相似度计算的方法初探[J];兰州工业高等专科学校学报;2009年04期

2 兰美辉;任友俊;徐坚;高炜;;k-部排序本体相似度计算[J];计算机应用;2012年04期

3 詹志建;梁丽娜;杨小平;;基于百度百科的词语相似度计算[J];计算机科学;2013年06期

4 田芳;;基于词语情感倾向的问句相似度计算[J];安庆师范学院学报(自然科学版);2014年02期

5 李锋,周凯波,冯珊;基于统计特征的属性相似度计算模型[J];华中科技大学学报(自然科学版);2005年06期

6 李仲生;王家琴;;基于本体的上层概念间相似度计算的研究[J];科学技术与工程;2007年10期

7 智慧来;智东杰;刘宗田;;基于概念格的概念相似度计算[J];计算机科学;2008年09期

8 贾宗福;王知非;;中文句子相似度计算的研究[J];科技信息;2009年11期

9 袁正午;李玉森;张雪英;;基于属性的文本相似度计算算法改进[J];计算机工程;2009年17期

10 邓林;李斌;郑南;;基于本体相似度计算的研究[J];电脑知识与技术;2010年13期

中国重要会议论文全文数据库 前10条

1 刘磊;张桂平;蔡东风;季铎;;基于语义预测的双语术语相似度计算[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

2 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

3 吴志雄;;不精确数据的相似度计算[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年

4 王凯;李绍稳;张友华;刘超;;缺值背景中的粗糙形式概念相似度计算理论与方法[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年

5 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

6 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

7 郭文宏;范学峰;;基于语义词典和本体知识的概念相似度计算[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

8 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

9 关毅;王晓龙;王强;;论系统相似的度量[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

10 林民;宋柔;;基于结构描述的汉字字形相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年

中国重要报纸全文数据库 前1条

1 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年

中国博士学位论文全文数据库 前3条

1 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年

2 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年

3 任磊;推荐系统关键技术研究[D];华东师范大学;2012年

中国硕士学位论文全文数据库 前10条

1 薛慧芳;句子相似度计算理论及应用研究[D];西北大学;2011年

2 张玉娟;基于《知网》的句子相似度计算的研究[D];中国地质大学(北京);2006年

3 王石颖;基于情景框架和依存树的突发事件相似度计算[D];大连理工大学;2013年

4 张猛;基于话题的事件相似度计算[D];河北大学;2014年

5 张福华;本体自动生成中词汇相似度计算的研究[D];大连海事大学;2008年

6 李国佳;汉语全文相似度计算的研究及应用[D];电子科技大学;2011年

7 孙鸿伟;基于相似度计算的编程题自动评判方法研究[D];哈尔滨工程大学;2011年

8 郭勇;基于《知网》的词语相似度计算研究及应用[D];湖南大学;2012年

9 刘俊;基于依存关系的汉语复句内分句的相似度计算[D];华中师范大学;2014年

10 唐琦;基于语义分析的句子相似度计算研究[D];华北电力大学(北京);2009年



本文编号:973517

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/973517.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8af38***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com