当前位置:主页 > 科技论文 > 搜索引擎论文 >

智能健康知识问答系统的研究与实现

发布时间:2017-10-31 21:01

  本文关键词:智能健康知识问答系统的研究与实现


  更多相关文章: 问答系统 中文分词 相似度 语义推理 AIML


【摘要】:随着信息技术的发展,人们已习惯于从互联网上获取各类信息,这得益于搜索引擎技术的发展。然而,搜索引擎仍然有一些问题没有解决。首先是用户检索时,相关信息返回太多且不精确,其次是检索只能按关键字进行匹配,实际上并不能精确表达人们的检索需求。由于上述问题的存在,发展在信息检索技术之上的问答系统应运而生。与国外问答系统相比,中文问答系统起步较晚,目前的中文问答系统仍然存在一些问题,例如:反应速度慢、正确率低、推理能力差等。针对问答系统的这些问题,本文对健康领域的问答系统的若干关键技术问题进行了研究,引用了一种多策略混合的问答系统模型。研究主要内容如下:首先构建健康领域的专业词库,AIML(人工智能标记语言)知识库、本体知识库、问题库等;其次在现有中文分词的基础上,进行词类标注、同义词替换、剪枝处理等;然后引入适用于健康领域的基于词语权重的句子相似度计算算法和推荐度算法;最后改进ALICE系统使其支持汉语,并且在其自身匹配推理的基础上,扩展语义推理接口。通过实验与基于语句相似度的现有问答系统进行对比,验证本文问答系统的答疑性能。通过实验结果可知,本文的问答系统在一定程度上提高了问答系统的推理能力、查全率和查准率,从而推动了信息检索和智能问答系统的研究和发展。
【关键词】:问答系统 中文分词 相似度 语义推理 AIML
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【目录】:
  • 摘要5-6
  • ABSTRACT6-11
  • 第1章 绪论11-15
  • 1.1 背景和研究意义11-12
  • 1.2 国内外研究现状12-13
  • 1.3 本论文研究内容13-14
  • 1.4 论文组织结构14-15
  • 第2章 相关技术概述15-23
  • 2.1 《知网》简介15-17
  • 2.1.1 《知网》的关系结构15-16
  • 2.1.2 《知网》的义原概念16-17
  • 2.2 词语相似度计算17-19
  • 2.3 本体论19-21
  • 2.3.1 本体的概念和描述语言19-20
  • 2.3.2 健康领域本体的特点20-21
  • 2.4 ALICE系统介绍21-22
  • 2.5 本章小结22-23
  • 第3章 中文分词与问句处理23-35
  • 3.1 常见的中文分词23-24
  • 3.1.1 基于字典匹配的分词方法23
  • 3.1.2 基于语义理解的分词23-24
  • 3.1.3 基于词频统计的分词24
  • 3.2 分词对比实验24-28
  • 3.2.1 分词注意难点24-26
  • 3.2.2 分词器对比26-27
  • 3.2.3 健康领域分词实验27-28
  • 3.3 健康领域词典的构建28-32
  • 3.3.1 健康领域字典的数据来源28-29
  • 3.3.2 领域词典的构建29-32
  • 3.3.3 构建词典后分词实验32
  • 3.4 词类标注32-34
  • 3.4.1 健康领域的词类标注33
  • 3.4.2 词类标注过程33-34
  • 3.5 本章小结34-35
  • 第4章 问句相似度和推荐度的算法研究35-47
  • 4.1 问句相似度概述35-36
  • 4.1.1 问句相似度计算特点35
  • 4.1.2 汉语句子相似度计算的难点35-36
  • 4.1.3 问句相似计算的意义36
  • 4.2 改进的问句相似度算法36-39
  • 4.2.1 影响问题相似度的因素36-37
  • 4.2.2 基于概念词的问句相似度算法37-38
  • 4.2.3 基于问句长度的相似度算法38
  • 4.2.4 改进的问句相似度计算算法38-39
  • 4.3 健康领域的问题相关推荐度的算法39-41
  • 4.3.1 影响问题推荐度的因素39
  • 4.3.2 问题推荐度计算39-41
  • 4.4 实验设计与结果分析41-46
  • 4.4.1 问题相似度算法实验41-42
  • 4.4.2 问题相似度对比实验42-44
  • 4.4.3 问题推荐度算法实验44-45
  • 4.4.4 问题推荐度对比实验45-46
  • 4.5 本章小结46-47
  • 第5章 ALICE扩展47-61
  • 5.1 人工智能语言AIML47-50
  • 5.1.1 AIML知识库47-48
  • 5.1.2 ALICE的内部推理机制48-49
  • 5.1.3 AIML的优缺点49-50
  • 5.2 AIML汉语扩展50-54
  • 5.2.1 分词处理51-52
  • 5.2.2 同义词处理52-53
  • 5.2.3 句式变换53
  • 5.2.4 AIML知识库构建53-54
  • 5.3 AIML语义接口扩展54-55
  • 5.3.1 AIML扩展模板54-55
  • 5.3.2 AIML扩展实例55
  • 5.4 ALICE语义推理扩展55-60
  • 5.4.1 Jena及其结构55-56
  • 5.4.2 Jena推理机56-59
  • 5.4.3 语义推理实验59-60
  • 5.5 本章小结60-61
  • 第6章 智能问答系统的实现61-75
  • 6.1 系统的总体结构61-66
  • 6.1.1 多策略混合模型61-63
  • 6.1.2 系统的总体架构63-64
  • 6.1.3 系统流程图64-66
  • 6.2 系统的实现66-72
  • 6.2.1 系统库的构建66-67
  • 6.2.2 问题列表的建立67-68
  • 6.2.3 用户应用层的功能68-69
  • 6.2.4 系统界面展示69-72
  • 6.3 实验结果与分析72-74
  • 6.3.1 系统性能测试72-74
  • 6.3.2 系统问题抽取能力测试74
  • 6.4 本章小结74-75
  • 第7章 总结与展望75-77
  • 7.1 论文总结75
  • 7.2 下一步研究方向75-76
  • 7.3 本章小结76-77
  • 参考文献77-81
  • 攻读学位期间发表的论著81-83
  • 致谢83

【相似文献】

中国期刊全文数据库 前10条

1 毛先领;李晓明;;问答系统研究综述[J];计算机科学与探索;2012年03期

2 莫丽萍,王树西,姜吉发,雷雨霞;问答系统和浅层结构模式推理[J];广西师范大学学报(自然科学版);2004年01期

3 卢志坚,张冬茉;中文问答系统中的问句理解[J];计算机工程;2004年18期

4 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期

5 林晓庆;;问答系统中基于列表类问题的研究[J];电脑知识与技术(学术交流);2007年07期

6 张积宾;徐志明;王恒;潘启树;;面向大规模网络数据的社会化问答系统[J];哈尔滨工业大学学报;2008年12期

7 贾君枝;毛海飞;;汉语框架网络问答系统问句处理研究[J];图书情报工作;2008年10期

8 胡小华;刘轩;刘丹;陆伟;;基于冗余的仿真问答系统的轻量级局部文本分析[J];图书情报知识;2009年01期

9 张中峰;李秋丹;;社区问答系统研究综述[J];计算机科学;2010年11期

10 陈玉;;基于“为什么”问句的中文问答系统研究[J];农业网络信息;2010年11期

中国重要会议论文全文数据库 前10条

1 何靖;陈,

本文编号:1123723


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1123723.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c2f5c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com