基于智能语音交互技术的智慧语音助理系统实现
本文关键词:基于智能语音交互技术的智慧语音助理系统实现
【摘要】:随着移动互联网的到来,各种移动终端设备正在越来越多被应用到人们的日常生活中,尤其是智能手机的应用,它让人们可以随时随地娱乐、上网等,但随着手机功能增强,人们和智能手机的交互复杂度也越来越大。近年来对语音交互技术已逐步被应用到智能手机中,人们可以使用语音实现语音拨打电话、发送短信等功能;也可以收听手机新来电话、信息等,使用者不用转移双眼就可以完成电话接听、信息查看。目前的手机语音应用一般采用多次语音交互完成特定任务,这从根本上来讲并没有提升人机交互的效率,反而由于多次语音交互降低了语音识别率,增加交互的次数。多次语音交互无法体现语音技术的便捷性,并且增加了人机交互的复杂度。课题针对安卓智能手机应用场景提出一种语音交互方案,用户通过说出多命令词控制智能手机完成基本通讯、日常使用信息查询等复杂的任务,如“打电话/发短信给XXX”、“我想听XXX的歌”等,智能手机终端也自动将任务执行结果播报给用户,整个语音交互过程摒弃了繁琐的多步对话确认,解放了用户的眼睛和手,相比于传统点击、触控交互方式,该语音交互方案很大程度提升了人机交互的便捷性。同时,本课题将基于安徽科大讯飞信息科技股份提供的语音技术开放平台研制的语音交互系统应用到Android智能手机上,开发了智慧语音手机助理软件,软件结构主要由语音识别、语音合成、音频任务调度、语音交互服务管理等子模块构成,语音交互管理模块负责整体的任务调度,首先调用语音识别服务识别用于语音,并将识别结果发送给相应的业务流程,然后根据业务需要调用语音合成模块对业务结果进行播报;而音频任务调度模块随时监听音频任务的变化,当有新的用户音频数据进入时,调度模块根据业务设计逻辑决定是否结束当前任务流程,开始新的任务流程。通过模块之间有序的任务协调及管理,避免了多次语音交互时相互之间的干扰。经过大规模数据验证,语音交互系统在智能Android手机上运行稳定。系统在办公室等相对安静环境下的识别率达到90%,在驾车关窗低车载噪音环境中识别率达85%,单次语音交互时间小于3S,很好的验证了语音交互系统的可用性。
【关键词】:语音对话 智慧语音助理 命令词控制
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.52;TN912.3
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-11
- 1.1 课题研究背景及意义8-9
- 1.2 课题国内外研究现状9
- 1.3 本论文主要研究内容9-10
- 1.4 本论文的组织结构10
- 1.5 本章小结10-11
- 第二章 语音人机交互技术11-17
- 2.1 人机交互技术11-12
- 2.1.1 人机交互模型11-12
- 2.1.2 人机交互基本流程12
- 2.2 语音合成技术12-14
- 2.2.1 基本概念12-13
- 2.2.2 语音合成的方法13-14
- 2.3 语音识别技术14-16
- 2.3.1 基本概念14-15
- 2.3.2 语音识别方法15-16
- 2.4 本章小结16-17
- 第三章 智慧语音助理系统方案的设计17-27
- 3.1 智慧语音助理交互方案特性17-18
- 3.2 智慧语音助理语音交互系统介绍18-19
- 3.3 智慧语音助理的核心子系统19-26
- 3.3.1 MSP语音云平台19-22
- 3.3.2 智慧语音助理客户端22-25
- 3.3.2.1 Web与引擎的交互22-23
- 3.3.2.2 Native与引擎的交互23-24
- 3.3.2.3 Web与Native的交互24-25
- 3.3.3 语音能力的输入输出25-26
- 3.4 本章小结26-27
- 第四章 智慧语音助理手机客户端的实现27-54
- 4.1 系统开发环境27
- 4.2 科大讯飞MSP语音服务平台接入27-35
- 4.2.1 语音识别引擎27-33
- 4.2.1.1 语法功能29-30
- 4.2.1.2 语音识别框架及逻辑实现30-33
- 4.2.2 语音合成引擎33-35
- 4.2.3 语音听写35
- 4.3 智慧语音助理客户端35-49
- 4.3.1 业务层的总体架构36-37
- 4.3.1.1 插件管理框架36
- 4.3.1.2 中间件容器36-37
- 4.3.2 单业务模块结构37-39
- 4.3.2.1 web层总体架构38-39
- 4.3.3 客户端业务层架构实现39-42
- 4.3.3.1 语音交互调度模块40-41
- 4.3.3.2 音频任务控制模块41
- 4.3.3.3 应用程序接口实现41-42
- 4.3.4 单业务模块实现—打电话42-49
- 4.4 智能语音助理系统运行测试及界面展示49-52
- 4.4.1 系统运行流程50-51
- 4.4.2 运行结果分析51
- 4.4.3 智慧语音助理使用流程及界面展示51-52
- 4.5 本章小结52-54
- 第五章 总结与展望54-56
- 5.1 总结54
- 5.2 下一步工作54-56
- 参考文献56-58
- 致谢58
【相似文献】
中国期刊全文数据库 前10条
1 邴志刚,刘媛,崔世钢;机器人开发平台中语音交互系统的实现[J];天津职业技术师范学院学报;2004年02期
2 ;首台美女机器人亮相[J];科技与经济画报;2006年03期
3 施寒潇;;基于互联网语音交互系统的研究与实现[J];计算机系统应用;2006年02期
4 韩超;刘加;;新型多模态人性化语音交互系统[J];电声技术;2009年08期
5 禅影;争锋,在人机语音交互的技术制高点[J];软件工程师;2001年12期
6 李丽;;人机语音交互技术的原理及发展前景[J];科技资讯;2013年32期
7 易定;用Microsoft Speech SDK5.1实现中文语音交互的方法[J];电脑开发与应用;2005年04期
8 陈斌,郭大勇,施克仁;用于拟人机器人的嵌入式语音交互系统研究[J];机器人;2003年05期
9 庾锡昌;刘伟平;武晋;黄红斌;;基于VoiceXML的语音交互平台的设计与实现[J];计算机工程与设计;2007年08期
10 姜晓庆;崔世耀;殷艳华;;人机语音交互中的情感语音处理[J];济南大学学报(自然科学版);2008年04期
中国重要会议论文全文数据库 前3条
1 徐波;;海量音频处理及嵌入式语音交互[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
2 张战锋;韦玮;吕成兴;李成荣;;人机语音交互平台以及在Linux下的移植实现[A];第九届全国人机语音通讯学术会议论文集[C];2007年
3 李雪峰;付慧生;周敏;;具有语音交互功能的电子钟的设计与实现[A];第十六届全国煤炭自动化学术年会、中国煤炭学会自动化专业委员会学术会议论文集[C];2006年
中国重要报纸全文数据库 前4条
1 郑阳;嵌入式语音交互技术[N];人民邮电;2014年
2 ;云之声牵手英特尔 语音交互助力芯突破[N];中国计算机报;2014年
3 本报记者 王哲玮 实习记者 梁菲;语音交互 王者归来[N];计算机世界;2012年
4 ;快人快语 随身接入[N];网络世界;2003年
中国博士学位论文全文数据库 前1条
1 王智国;嵌入式人机语音交互系统关键技术研究[D];中国科学技术大学;2014年
中国硕士学位论文全文数据库 前9条
1 顾亚平;基于智能语音交互技术的智慧语音助理系统实现[D];南京邮电大学;2015年
2 贾玉辉;面向语音交互的云计算系统的研究[D];中国海洋大学;2013年
3 朱润华;网络环境下基于语音交互的虚拟装配系统研究[D];西南交通大学;2008年
4 宁正华;Space OS服务秘书语音交互系统的研究与实现[D];首都师范大学;2009年
5 于贵博;高校医院管理及疾病预警系统[D];吉林大学;2005年
6 李金耀;One-Shot车载语音交互系统的设计与实现[D];安徽大学;2012年
7 于基业;GIS图形系统中语音交互核心问题的研究[D];长安大学;2014年
8 鲍艳艳;机器人语音交互系统的研究与设计[D];东北大学;2012年
9 李永量;基于SALT的网上直销系统的实现[D];四川大学;2004年
,本文编号:1019786
本文链接:https://www.wllwen.com/kejilunwen/wltx/1019786.html