中文问句理解技术研究及在IT领域问答系统中的应用
发布时间:2017-03-28 21:11
本文关键词:中文问句理解技术研究及在IT领域问答系统中的应用,由笔耕文化传播整理发布。
【摘要】:问答系统(Question Answering System,QA)是新一代智能搜索引擎,它允许用户以自然语言提问,并能够向用户返回准确的答案。与传统的关键词检索相比,问答系统能够更好满足用户对快速、准确地获取信息的需求。问句理解是问答系统的一个非常重要的组成部分,它的准确性直接影响到系统的准确率。本文以知网为基础,初步建立起基于疑问意向问句分类机制;然后,根据分类的语义块特征提取得到语义理解模型;其次,以问句句型和疑问焦点识别为基础,针对中文句子的提问目的,提出多特征多层次结合的句子相似度计算方法;最后,根据上述提到的理论方法,建立一个实际应用模型。具体来说,本文主要的实际性工作和取得的主要成果如下:1.对中文问句的特点进行分析,提出基于疑问意向的问句分类方法,通过提取问句的疑问焦点、句法和句子成分的语义角色三方面内容,将问句的各个组成成分归类到事件语义块,问点块,其他语义块等三大语义块,并对各个语义块进行提取,建立问句的语义理解模型;2.问句提取意图的方法随着问句类型的不同而有一定的差异,即意图提取的研究对象是疑问句。本文的研究背景是自然语言问答系统,通过大量分析语料,再依据不同疑问句出现的频率多少,将疑问句类型分为特指问句,正反问句,句末语助词问句这三类,最后依据疑问句类型提出有针对性的问句意图提取方法;3.通过分析和研究现有问句相似度计算方法的局限,提出利用多层次多特征的融合的汉语句子相似度计算方法。主要思想如下:第一步,针对用户所提出的疑问句,采用自然语言处理中的技术来分析问题,可以将用户的问句分为问句意图和关键词集这两个部分。第二步,考虑目标层、结构层和语义层,包括意图、关键词、句子长度等多种特征。第三步,确定句子相似度的值,即运用一种简单有效的融合手段来获取综合特征,再根据综合特征确定句子相似度的值;4.最后,将本文所研究的问句理解技术和利用有别于现有句子相似度的计算新方法应用于IT领域自然语言问答系统中。面向IT领域的自动问答系统的测评结果表明该方法具有一定的可行性和较高的实用价值。
【关键词】:中文问答系统 问句理解 查询意图 语义块 问句相似度
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
- 摘要5-6
- Abstract6-11
- 第一章 绪论11-16
- 1.1 选题背景及意义11-12
- 1.2 国内外研究现状12-14
- 1.2.1 国外研究现状12-13
- 1.2.2 国内研究现状13-14
- 1.3 主要研究内容14
- 1.4 论文结构安排14-16
- 第二章 中文问答系统概述及相关技术16-23
- 2.1 问答系统的处理流程16-17
- 2.2 中文自动分词技术17-18
- 2.3 依存文法18-19
- 2.4 知网语义知识资源19-21
- 2.4.1 知网的义原19-20
- 2.4.2 知网的概念20-21
- 2.5 同义词词林21-22
- 2.6 本章小结22-23
- 第三章 中文问句理解技术研究23-43
- 3.1 问句理解流程体系23
- 3.2 基于疑问意向的问句分类23-28
- 3.3 问句分类的语义块特征提取28-32
- 3.3.1 问句语义块的定义28-29
- 3.3.2 问点块的提取29-30
- 3.3.3 事件语义块提取30-31
- 3.3.4 其他语义块提取31-32
- 3.4 问句语义理解模型的分析过程32-35
- 3.5 问句的句型分析和疑问焦点识别35-38
- 3.5.1 中文问句句式类型35-36
- 3.5.2 特指问句类型和疑问焦点36-38
- 3.6 问句意图的提取38-42
- 3.6.1 问句意图的含义38
- 3.6.2 问句意图的表示方法38-39
- 3.6.3 问句意图的提取39-42
- 3.7 本章小结42-43
- 第四章 问答系统的问句相似度43-51
- 4.1 句子相似度研究43-45
- 4.1.1 句子相似度的定义43
- 4.1.2 句子相似度常用计算方法43-45
- 4.2 多层次多特征融合的问句相似度计算45-50
- 4.2.1 设计思想45-46
- 4.2.2 查询意图的相似度计算46
- 4.2.3 关键字集的相似度计算46-48
- 4.2.4 其他相似度特征因素的计算48-49
- 4.2.5 多层次多特征融合的问句相似度计算49-50
- 4.3 本章小结50-51
- 第五章 问句理解技术在IT领域问答系统中的应用51-61
- 5.1 系统总体设计方法51-52
- 5.2 系统的框架和各模块体系52-55
- 5.2.1 问句理解模块52-54
- 5.2.2 答案抽取模块54-55
- 5.3 实验过程及结果评价55-60
- 5.3.1 问句分类测评分析56-59
- 5.3.2 问句相似度算法测评59-60
- 5.4 本章小结60-61
- 总结与展望61-63
- 参考文献63-68
- 致谢68-69
- 附件69
【参考文献】
中国期刊全文数据库 前2条
1 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
2 周流溪;近五十年来语言学的发展(中)[J];外语教学与研究;1997年04期
中国硕士学位论文全文数据库 前2条
1 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
2 张玉娟;基于《知网》的句子相似度计算的研究[D];中国地质大学(北京);2006年
本文关键词:中文问句理解技术研究及在IT领域问答系统中的应用,由笔耕文化传播整理发布。
,本文编号:273035
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/273035.html