GIS图形系统中语音交互核心问题的研究
发布时间:2017-07-03 23:07
本文关键词:GIS图形系统中语音交互核心问题的研究
更多相关文章: 语音交互 语音识别 语言理解 GIS图形系统 交互语义推理
【摘要】:人机交互是研究人与硬件环境及二者相互影响的领域,交互过程是人与硬件系统之间各种符号与动作的双向信息交换。本质上,是人类的操作行为,借助交互环境的硬件设施作用于系统数据,完成目标信息的输入、转换、加工和输出,并获得硬件系统的操作反馈的过程。随着交互设计、人工智能的不断发展,人机交互由传统的键盘鼠标交互模式发展到智能的、多通道、多媒体的交互方式。语音交互是智能交互的一种,即利用人类语言表达交互语义,系统识别操作者的声音信息,完成音频提取并翻译,映射到相应的功能响应。语音交互是目前最接近于自然交互的方式之一。 GIS系统的现状是功能强大但交互方式单一,造成了在某些环境下的交互不便利。扩展GIS交互方式不能生搬硬套其它系统,应充分研究分析GIS的交互特征,因地制宜。GIS的交互对象是空间数据,交互操作是对空间数据的增、删、改等加工处理和对GIS系统环境的控制,其交互语言语义明确,语法规则具有规律。本文围绕着将语音交互引入到GIS图形系统领域这一目的,开展以下研究工作: 1.语音交互模式 对语音交互领域的相对成熟的技术体系展开研究,探索交互模式,分析交互流程。重点剖析语音识别、语义理解和语音交互设计三项核心技术。 2.语音识别 研究语音识别理论,提取音频识别模型,总结音频处理的难点和解决方法。根据现有的语音识别技术,确定一个有限词汇量、特定人、孤立词的语音识别方案;利用现有的技术实现语音识别的原型系统。 3.GIS图形系统交互语言理解 将语言理解限定在GIS图形系统领域内,,从典型的GIS图形系统的功能反向分析交互语义,总结交互命令语言特征,并由交互语义制定GIS图形系统的领域词汇表。将领域词汇分为名词类型和动词类型,分别利用概念从属结构和网络结构完成名词知识与动词知识的建模;由交互语言特征,总结出一个GIS图形系统交互的基本语法——“名-动-名/形/副”,以此语法为基准,结合概念从属理论,制定了语义推理的方法。采用链接文法,以文件的方式为系统的名词概念知识和动词概念知识建模,将推理出的语义映射系统的功能函数,实现交互的系统响应。最后,设计了一个原型系统,测试GIS图形系统的语音交互可行性。 论文的主要成果为:语音交互技术满足GIS图形系统交互的基本需求;论文提出的交互语言的概念知识能够表达操作行为的概念语义和人的观念;建立的语法与推理规则能正确推理交互语义,映射系统的功能。语音交互也将成为在不便于使用键盘鼠标的交互环境(如外业调绘、野外数据采集)下的重要交互方式。
【关键词】:语音交互 语音识别 语言理解 GIS图形系统 交互语义推理
【学位授予单位】:长安大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:P208
【目录】:
- 摘要4-6
- Abstract6-11
- 第一章 绪论11-21
- 1.1 研究背景和意义11-12
- 1.1.1 研究背景11-12
- 1.1.2 研究意义12
- 1.2 国内外研究现状综述12-17
- 1.2.1 语音识别技术12-14
- 1.2.2 自然语言理解14-16
- 1.2.3 GIS 功能与操作16
- 1.2.4 综述总结与分析16-17
- 1.3 研究目标和研究内容17-18
- 1.3.1 研究目标17
- 1.3.2 研究内容17-18
- 1.4 研究方法与技术路线18-19
- 1.4.1 研究方法18
- 1.4.2 技术路线18-19
- 1.5 论文结构19-21
- 第二章 语音交互模式21-25
- 2.1 Siri 的交互模式21-22
- 2.2 Siri 的技术原理22-23
- 2.3 Siri 的交互设计23-24
- 2.4 本章小结24-25
- 第三章 语音识别理论与技术实现25-37
- 3.1 语音识别理论25-29
- 3.1.1 人类的语音识别模型25
- 3.1.2 计算机的语音识别模型25-27
- 3.1.3 语音识别的难点问题27-28
- 3.1.4 语音识别模式的选择28-29
- 3.2 语音识别的技术实现29-36
- 3.2.1 基于 InterReco 的语音识别实现29-33
- 3.2.2 基于 SAPI 的语音识别实现33-35
- 3.2.3 两种语音识别实现方式的比较35-36
- 3.3 本章小结36-37
- 第四章 语言理解37-43
- 4.1 自然语言理解的基本理论研究37-40
- 4.1.1 语法为主的分析37
- 4.1.2 语义为主的分析37-39
- 4.1.3 基于知识的分析39-40
- 4.2 汉语自然语言理解研究40-42
- 4.3 领域汉语言研究42
- 4.4 本章小结42-43
- 第五章 GIS 图形系统交互语义理解43-63
- 5.1 GIS 图形系统交互语言研究43-56
- 5.1.1 GIS 图形系统的功能总结44-50
- 5.1.2 GIS 领域功能命令语言及特征总结50-53
- 5.1.3 GIS 图形系统交互语言的基本语法与概念知识53-56
- 5.2 GIS 图形系统交互语义推理56-62
- 5.2.1 推理方案的制定56-58
- 5.2.2 名词知识建模与推理58-61
- 5.2.3 动词知识建模与推理61-62
- 5.3 本章小结62-63
- 第六章 GIS 图形系统的语音交互模块实现63-70
- 6.1 GIS 图形系统语音交互模块总体设计63-64
- 6.2 语音交互知识库64-66
- 6.3 重要的算法设计与实现66-69
- 6.3.1 系统的核心算法流程66-67
- 6.3.2 语音交互的 GIS 图形原型系统67-69
- 6.4 本章小结69-70
- 结论与展望70-72
- 结论70
- 展望70-72
- 参考文献72-75
- 致谢75
【参考文献】
中国期刊全文数据库 前10条
1 孙光民,董笑盈;基于神经网络的汉语孤立词语音识别[J];北京工业大学学报;2002年03期
2 刘彬;董金明;;语音识别系统[J];电子测量技术;2005年06期
3 袁保宗,阮秋琦,王延江,刘汝杰,唐晓芳;新一代(第四代)人机交互的概念框架特征及关键技术[J];电子学报;2003年S1期
4 魏世强,黄河燕,陈肇雄;文法理论评述[J];计算机工程与应用;2003年01期
5 李禹材,左友东,郑秀清,王玲;基于Speech SDK的语音控制应用程序的设计与实现[J];计算机应用;2004年06期
6 李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期
7 於家;吴健平;干嘉元;;基于GIS应用软件的交互设计方法研究[J];计算机应用与软件;2010年01期
8 李冠宇;;隐马尔可夫模型及其在语音识别中的应用[J];科技风;2011年23期
9 蔡莲红;崔丹丹;蔡锐;;汉语普通话语音合成语料库TH-CoSS的建设和分析[J];中文信息学报;2007年02期
10 黄曾阳;HNC理论概要[J];中文信息学报;1997年04期
本文编号:515502
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/515502.html