IT领域问答系统的研究与实现
发布时间:2017-05-21 08:28
本文关键词:IT领域问答系统的研究与实现,,由笔耕文化传播整理发布。
【摘要】:随着互联网的发展和应用,网上的信息迅速增长。人们希望能从海量的网络内容获取自己所需要的信息。搜索引擎的出现从很大程度上解决了这个问题。人们只需输入一些关键字,搜索引擎就会返回相关的网页。但是面对繁多的网页信息,用户很难迅速找到自己所需的内容。因此,为了满足人们能够更快速、准确地获取信息的愿望,自动问答系统(automatic Question Answering System,QA)逐渐发展起来。自动问答系统允许用户使用自然语言进行提问,并针对问题返回一个简洁准确的答案。它综合运用多种自然语言处理技术,是计算机应用领域研究的热点之一。目前,英文问答系统的研究已比较成熟,由于中文自然语言的复杂性,因此中文问答系统的研究还处于初步阶段。本文研究的是基于IT领域中文自动问答系统。本文根据IT领域数据的特点,开发出一个在中华字库项目下基于常用问题库(FAQ)的中文问答系统。本系统主要完成对IT领域数据的构建,计算句子相似度算法等方面的内容。在构建IT领域数据部分,研究设计了IT领域数据结构、FAQ存储方式、对FAQ进行预处理;句子相似度计算部分,采用了基于语义的相似度计算方法,并建立了相应的问题测试集进行试验,文章最后介绍了整个自动问答系统的实验结果及其评价。本文的主要工作包括:(1)分析了IT领域数据组成。本文涉及的IT领域数据包括QA数据、IT领域词典、专家问答库。(2)使用ICTCLAS分词技术,实现对问题的分词处理。使用基于语义的句子相似度计算方法,对用户问题与数据库中问题进行相似度的计算,从数据库中寻找匹配的问句及答案返回给用户。(3)开发出一个FAQ自动问答系统,为中华字库项目使用人员提供了关于项目的常见问题的解答。
【关键词】:FAQ问答系统 问句相似度 知网
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要5-6
- Abstract6-12
- 第一章 绪论12-17
- 1.1 前言12
- 1.2 国内外研究现状12-14
- 1.2.1 国外研究现状12-13
- 1.2.2 国内研究现状13-14
- 1.3 立题意义14-15
- 1.4 本文的工作内容15
- 1.5 论文的组织结构15-16
- 1.6 本章小结16-17
- 第二章 相关技术研究17-33
- 2.1 问答系统核心研究模块17-19
- 2.2 中文自动分词技术19-21
- 2.2.1 中文自动分词的意义19-20
- 2.2.2 中文自动分词的方法20-21
- 2.3 语义词典资源21-25
- 2.3.1《知网》词典介绍21-22
- 2.3.2《知网》的结构22
- 2.3.3《同义词词林》介绍22-25
- 2.4 词语的相似度计算25-28
- 2.4.1 基于《同义词词林》的计算25-27
- 2.4.2 基于《知网》的计算27-28
- 2.4.3 词语相似度计算评价28
- 2.5 句子的相似度计算[44]28-32
- 2.5.1 句子相似度的概念28-29
- 2.5.2 基于向量空间模型的TF-IDF方法29-30
- 2.5.3 基于语义依存的计算30
- 2.5.4 基于语义距离的计算30-31
- 2.5.5 编辑距离计算方法31
- 2.5.6 语句相似度计算的评价31-32
- 2.6 本章小结32-33
- 第三章 IT领域数据组成和构建33-39
- 3.1 概述33
- 3.2 QA数据库33-35
- 3.2.1 QA数据结构34
- 3.2.2 数据存储结构34-35
- 3.3 IT领域词典35-37
- 3.3.1 IT领域词典概念35
- 3.3.2 IT领域词典建立35-37
- 3.4 专家问答库37-38
- 3.4.1 索引表的建立37-38
- 3.5 本章小结38-39
- 第四章 问答系统的总体设计39-46
- 4.1 问答系统设计框架39
- 4.2 问句理解部分39-42
- 4.2.1 分词系统40
- 4.2.2 问句分类40-41
- 4.2.3 关键词提取41-42
- 4.2.4 关键词扩展42
- 4.3 信息检索部分42-44
- 4.3.1 确定FAQ候选集43
- 4.3.2 词语相似度计算43
- 4.3.3 句子相似度计算43-44
- 4.4 答案抽取部分44
- 4.4.1 相似度排序44
- 4.5 本章小结44-46
- 第五章 需求分析与概要设计46-64
- 5.1 需求分析概述46
- 5.1.1 功能简介46
- 5.2 功能需求46-55
- 5.2.1 模块划分46-47
- 5.2.2 基本设计用例47-55
- 5.3 概要设计55-56
- 5.3.1 系统功能结构55-56
- 5.4 模块设计56-60
- 5.4.1 模块名称及功能56-59
- 5.4.2 限制条件59-60
- 5.5 运行设计60
- 5.5.1 运行模块组合60
- 5.5.2 运行控制60
- 5.6 数据结构设计60-63
- 5.6.1 数据库概念设计60-63
- 5.6.2 数据结构与程序的关系63
- 5.7 系统出错处理63
- 5.7.1 出错信息63
- 5.7.2 补救措施63
- 5.8 本章小结63-64
- 第六章 问答系统的实现64-71
- 6.1 系统总体支撑框架64-65
- 6.2 系统总体架构65
- 6.3 模块设计65-70
- 6.3.1 QA知识管理模块65-67
- 6.3.2 QA知识问答模块67-68
- 6.3.3 用户管理模块68-69
- 6.3.4 权限管理模块69
- 6.3.5 公告管理模块69-70
- 6.4 本章小结70-71
- 第七章 实验结果与分析71-79
- 7.1 实验环境与性能指标71-72
- 7.1.1 实验环境71
- 7.1.2 实验性能指标71-72
- 7.2 功能测试72-74
- 7.3 界面展示74-76
- 7.4 实验结果与分析76-78
- 7.5 本章小结78-79
- 第八章 总结与展望79-81
- 8.1 总结79
- 8.2 展望79-81
- 参考文献81-83
- 攻读硕士学位期间取得的研究成果83-84
- 致谢84-85
- 附件85
【相似文献】
中国期刊全文数据库 前10条
1 毛先领;李晓明;;问答系统研究综述[J];计算机科学与探索;2012年03期
2 莫丽萍,王树西,姜吉发,雷雨霞;问答系统和浅层结构模式推理[J];广西师范大学学报(自然科学版);2004年01期
3 卢志坚,张冬茉;中文问答系统中的问句理解[J];计算机工程;2004年18期
4 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期
5 林晓庆;;问答系统中基于列表类问题的研究[J];电脑知识与技术(学术交流);2007年07期
6 张积宾;徐志明;王恒;潘启树;;面向大规模网络数据的社会化问答系统[J];哈尔滨工业大学学报;2008年12期
7 贾君枝;毛海飞;;汉语框架网络问答系统问句处理研究[J];图书情报工作;2008年10期
8 胡小华;刘轩;刘丹;陆伟;;基于冗余的仿真问答系统的轻量级局部文本分析[J];图书情报知识;2009年01期
9 张中峰;李秋丹;;社区问答系统研究综述[J];计算机科学;2010年11期
10 陈玉;;基于“为什么”问句的中文问答系统研究[J];农业网络信息;2010年11期
中国重要会议论文全文数据库 前10条
1 何靖;陈
本文编号:383137
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/383137.html