小词汇量语音识别在旅行服务中的应用研究
发布时间:2017-05-24 20:23
本文关键词:小词汇量语音识别在旅行服务中的应用研究,,由笔耕文化传播整理发布。
【摘要】:随着人们生活水平的不断提高,旅游业在中国蓬勃发展。同时,信息技术的进步让旅行的过程变得更加便捷和丰富。目前,已出现了一些移动应用来帮助人们记录旅行过程,并自动生成游记。本文在对旅行记录类安卓应用进行调研和分析后,针对这类应用通常需要人工输入标注信息的问题,研究使用基于关键字的语音识别技术来代替手动标注,进一步改善用户体验。 本文简要介绍了语音识别技术的历史、原理和流程,重点研究了小词汇量语音识别和关键词识别技术及其在Android系统下的实现,论文的主要工作如下: (1)针对旅游应用的特点,本文利用爬虫技术在现有旅游网站上抓取了近4500份游记,经过词语提取和词频排序,最终选择50个词语作为本文语音识别系统的关键词词库。 (2)针对智能手机应用场景,本文对现有的语音识别引擎进行了分析和比较,选择了适用于移动终端的开源语音识别引擎——PocketSphinx。在详细研究PocketSphinx的源码、识别原理和工作流程的基础上,本文在Cygwin环境下搭建了PocketSphinx的运行和训练环境,对语言模型和发音字典进行了训练和制作,对语音素材在不同参数环境下的识别性能进行测试,选择了最优参数。 (3)设计并实现了具有关键词识别功能的旅游App。该应用利用JNI技术将PocketSphinx编译到Android端,使安卓应用可以调用语音识别接口。此外,本文还针对旅游服务类应用的特点,研究了地图、地理定位、数据库、照相机等技术,借助异步任务、手机传感器、缓存机制对应用进行了进一步的优化,提高了可用性。 基于本论文研究成果开发的安卓应用可以通过地图、图片和文字完整地记录旅行过程,并能借助语音识别技术方便地进行关键词的标注。经过了若干用户的使用和测试,系统运行稳定、交互友好,语音识别模块能够识别输入语句中80%以上的关键词,基本可以满足用户在旅行环境中的使用需求。
【关键词】:语音识别 关键词识别 PocketSphinx 旅游信息化
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 绪论9-16
- 1.1 旅游服务的研究背景9-10
- 1.2 与旅游相关的应用与系统10-13
- 1.2.1 面包旅行10-12
- 1.2.2 在路上12-13
- 1.3 本文的研究内容和组织结构13-16
- 1.3.1 主要研究内容13-14
- 1.3.2 章节安排14-16
- 第二章 小词汇量语音识别技术16-31
- 2.1 什么是语音识别16-18
- 2.1.1 什么是语音识别16
- 2.1.2 语音识别技术的分类16-17
- 2.1.3 语音识别的流程和算法17-18
- 2.2 语音识别的关键技术18-27
- 2.2.1 语音信号的预处理18-22
- 2.2.2 HMM的基本原理22-25
- 2.2.3 声学模型25
- 2.2.4 语言模型25-26
- 2.2.5 解码过程26-27
- 2.3 小词汇量语音识别27-28
- 2.4 关键词识别28-29
- 2.5 常见的语音识别系统29-31
- 2.5.1 CMU SPHINX29-30
- 2.5.2 HTK30
- 2.5.3 讯飞语音+30
- 2.5.4 本文选择的语音识别系统30-31
- 第三章 基于PocketSphinx的语音识别系统31-45
- 3.1 PockeSphinx对嵌入式平台的优化31-32
- 3.2 PocketSphinx主要模块32-35
- 3.2.1 语料库33
- 3.2.2 发音字典33-34
- 3.2.3 语言模型34-35
- 3.3 PocketSphinx的算法原理35-40
- 3.3.1 搜索结构的初始化36-37
- 3.3.2 语音预处理37-38
- 3.3.3 搜索步骤38-40
- 3.4 PocketSphinx的运行和性能分析40-42
- 3.5 基于PocketSphinx的小词汇量语音识别系统的优化42-45
- 第四章 小词汇量语音识别技术在旅行服务中的应用设计45-51
- 4.1 应用场景45
- 4.2 应用系统设计45-47
- 4.2.1 功能设计45-46
- 4.2.2 数据库设计46-47
- 4.3 系统主要功能模块47-48
- 4.4 语音系统的准备48-51
- 4.4.1 PocketSphinx-Android的编译48
- 4.4.2 关键词的选取48-51
- 第五章 小词汇量语音识别技术在旅行应用中的实现51-66
- 5.1 旅行应用的模块51-61
- 5.1.1 首页展示模块51-52
- 5.1.2 摄影模块的实现52-55
- 5.1.3 语音识别模块实现55-56
- 5.1.4 地图模块的实现56-59
- 5.1.5 游记列表模块的实现59-61
- 5.2 旅行应用的测试61-66
- 5.2.1 应用流程测试61-65
- 5.2.2 语音模块测试65-66
- 第六章 总结与展望66-68
- 6.1 全文总结66-67
- 6.1.1 论文主要工作66
- 6.1.2 论文成果66
- 6.1.3 问题分析66-67
- 6.2 未来展望67-68
- 参考文献68-70
- 致谢70
【参考文献】
中国期刊全文数据库 前5条
1 张恒喜;史争军;;基于SQLite的Android数据库编程[J];电脑编程技巧与维护;2011年21期
2 黎世红;程耕国;彭正涛;;基于Android平台的Camera系统研究及应用[J];电子设计工程;2013年06期
3 施舒阳;;使用Python在SNS获取和发布信息[J];电脑编程技巧与维护;2014年09期
4 许金如;;论中国旅游业发展的五大趋势[J];开发研究;2014年02期
5 傅细三;;旅游信息化研究文献综述[J];商业时代;2009年02期
本文关键词:小词汇量语音识别在旅行服务中的应用研究,由笔耕文化传播整理发布。
本文编号:391911
本文链接:https://www.wllwen.com/kejilunwen/wltx/391911.html
教材专著