当前位置:主页 > 科技论文 > 汽车论文 >

基于规则与统计方法口语理解的车载语音控制系统的设计与实现

发布时间:2020-06-21 11:23
【摘要】:基于语音控制的车载信息娱乐系统相对于传统的按键操作和触摸屏操作,减少了司机视线转移和双手转移的次数,提高了交通安全,增强了用户体验,逐渐成为主流车型的标配和卖点。但目前语音控制仍存在语音识别准确率比较低、语音命令比较呆板、用户体验差等问题。因此研究基于口语的语音控制系统具有很强的理论意义和实际价值。本论文提出了一套基于模版与基于统计的语义理解框架,该框架同时支持基于规则的语义理解和基于统计的语义理解,使得两种方法能够相互补充。实现基于自然语言的人机交互。主要工作和创新点如下:第一,基于语义模板的语义理解模块设计与实现。基于车载信息娱乐系统的功能需求和各个功能模块的接口定义语义模版;基于需要实现的功能搜集不同句型,将句型整理为正则表达式,并以XML格式进行存储,进而实现基于正则表达式匹配技术的模版匹配语义理解算法;设计基于Tire树的字典和基于关键字索引的快速查找算法,以提升语义理解性能。第二,基于规则、词典和统计相结合的命名实体识别设计与实现。阐述基于规则的命名识别基本原理,实现基于规则的联系人姓名模糊识别;阐述基于词典的命名实体识别基本原理,实现基于词典的艺术家和歌曲名词精确识别;阐述基于统计的命名实体识别的基本原理,标记地名和广播电台名词语料,实现基于条件随机场的地名识别和广播电台名词识别。第三,基于统计的语义理解模块设计与实现。结合中文分词和命名实体识别的结果,实现基于卡方检验算法的关键词与关键语义类的特征抽取和基于TF-IDF的特征权重计算;并在此基础上实现基于支持向量机的文本分类;标记信息抽取语料,实现基于条件随机场的语义参数抽取;最终实现基于统计的语义理解。实验结果表明,基于百度语音识别引擎,在安静环境下,运用普通话进行测试,导航、电话、广播和音乐等功能的整体语义理解准确率达到76.83%。对面向车载的自然语言理解有一定的理论意义和应用价值。
【学位授予单位】:河北科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:U463.6
【图文】:

框图,处理器,框图,娱乐系统


本论文的主要目的是研发一款面向车载领域的自然语言理解系统,实现基于自然语言的人机交互。本论文基于某款量产车载信息娱乐系统进行开发,原系统只支持通过触摸屏的方式实现人机交互,本论文对原系统进行升级,新增基于自然语言的人机交互功能。本章着重讨论系统架构设计。2.1 开发平台系统架构设计是系统功能实现的基础,在很大程度上决定了系统的稳定性、可扩展性和可维护性。同时,只有了解的系统的架构设计才能更好的实现系统的各个功能。接下来讲述本论文所选用的软硬件系统架构。2.1.1 硬件平台本论文所选择的车机基于 i.MX 6Quad 平台进行开发,该平台是飞思卡尔推出的一款基于 ARM Cortex -A9 架构的处理器平台。具有强大的计算能力、多媒体处理能力以及丰富的接口,符合车规级要求,是一款理想的车载信息娱乐系统的硬件平台。其处理器框图见图 2-1。

系统框架,操作系统


2.1.2 系统平台本论文选用 Linux 作为车机操作系统。Linux 是一款开源操作系统,支持 X86、ARM、MIPS 等主流 CPU 架构,支持 32 位和 64 位硬件,集成了串口、USB 等常用硬件驱动,支持多进程、多线程操作,支持 TCP/IP 网络协议栈,用户可以根据具体需求对内核进行裁剪,是车机常用的操作系统之一。Linux 系统架构图如图 2-2 所示:视频编码 1080p 30Hz h.264存储器 DDR2 个 32 LP-DDR2,1 个 64DDR3/LV-DDR3数据接口 4 个 USB2.01 个 Host OTG+PHY1 个 Host USB HSIC扩展端口 2 个 SD/MMC 4.4,1 个 SDXC5 个 SPI,5 个 UART显示 2 x 4XGA (2048x1536)或 2 x [1080p + WXGA(1280x720)]

【参考文献】

相关期刊论文 前10条

1 陈振锋;杨晓昊;吴蔚澜;刘加;夏善红;;航班预定口语对话系统的设计与实现[J];中国科学院大学学报;2015年02期

2 李澎林;张献力;李伟;;基于双字Hash机制的交通信息分词算法研究[J];浙江工业大学学报;2014年06期

3 许坤;冯岩松;赵东岩;陈立伟;邹磊;;面向知识库的中文自然语言问句的语义理解[J];北京大学学报(自然科学版);2014年01期

4 张志飞;苗夺谦;高灿;;基于LDA主题模型的短文本分类方法[J];计算机应用;2013年06期

5 崔建明;刘建明;廖周宇;;基于SVM算法的文本分类技术研究[J];计算机仿真;2013年02期

6 刘畅;;中文全文检索技术研究[J];吉林广播电视大学学报;2012年03期

7 逯万辉;马建霞;;基于条件随机场模型的复杂时间信息抽取研究[J];现代图书情报技术;2011年10期

8 宋淑彩;庞慧;丁学钧;;GA-SVM算法在文本分类中的应用研究[J];计算机仿真;2011年01期

9 习明;王增辉;庄怡;;基于双层哈希表的中文分词算法优化[J];软件导刊;2010年10期

10 吴尉林;陆汝占;段建勇;刘慧;高峰;陈玉泉;;基于两阶段分类的口语理解方法[J];计算机研究与发展;2008年05期

相关博士学位论文 前2条

1 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年

2 吴尉林;可移植的稳健口语理解方法研究[D];上海交通大学;2007年

相关硕士学位论文 前8条

1 须啸海;嵌入式智能交通车流量监控系统的实现[D];电子科技大学;2015年

2 刘浩;面向情感搜索的中文语料分析及其分词[D];北京邮电大学;2014年

3 成锐;基于lucene面向主题的手机搜索引擎的研究与实现[D];电子科技大学;2012年

4 张佳宝;基于条件随机场的中文命名实体识别研究[D];国防科学技术大学;2010年

5 薛璐影;文本情感分类相关问题研究[D];哈尔滨工业大学;2010年

6 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年

7 许晓丽;面向信息抽取的中文命名实体识别研究[D];哈尔滨工程大学;2009年

8 张剑;基于CRF的英文命名实体识别研究[D];哈尔滨工业大学;2006年



本文编号:2723996

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/qiche/2723996.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8cdbc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com