基于语音技术的车辆检修计算机辅助系统设计与实现
发布时间:2022-01-20 13:02
语音技术是一门融合了语言学、声学、计算机学等多学科的人工智能技术。近年来随着计算机性能的不断提升,信号处理技术的不断完善以及人工智能理论的不断突破。语音技术日益成熟,并且已经具备了较强的应用属性,国内外都纷纷将语音技术应用到各行各业中,去代替传统技术并解决疑难问题。在车辆研究领域,车辆检修是十分重要的一环。目前所采用的车辆检修方式存在错检、漏检,检修效率低,检修手工记录,检修成本高等问题。伴随着车辆检修业务的不断调整以及社会向信息化发展的趋势,这种检修方式已经无法满足现代车辆检修业务的需求。因此,本文针对以上问题,通过利用数据库技术、网络技术和日益成熟的语音技术,设计了一套基于语音技术的车辆检修计算机辅助系统。系统采用语音技术取代纸质检修表,实现了无纸化办公;通过简化车辆检修流程,节约检修成本,提高检修效率。本文选用SSM框架对系统进行详细的实现,并将系统分为四个模块:ASR模块、TTS模块、检修管理员系统、检修专员系统。ASR模块采用Julius作为语音识别引擎,并被编译成动态链接库DLL,负责对检修结果语音进行识别;TTS模块采用SAPI作为语音合成引擎,并被编译成动态链接库DLL...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:106 页
【学位级别】:硕士
【部分图文】:
图2-1?ASR系统框架??1)语音预处理:对输入的语音信号进行预处理工作可以起到消除语音噪声,??
方式在核心实现上并无太大差异,??主要的不同在于:前者通过将Julius作为ASR识别引擎,直接嵌入到系统中,??应用程序通过调用本地Julius实现语音识别;后者需要通过soceket套接字进行??应用交互,依赖于客户端-服务器结构。前者的优点在于:即使在无网络的情况??下,也能进行语音识别。后者的优点在于:将Julius与本地系统直接隔离开,用??户可以在不同地方去分别搭建应用程序,然后通过广域网接入Julius实现语音识??另1J,更加灵活方便。Julius与应用程序连接方式如图2-2所示。??——I?y?T*Lsn ̄ ̄i?——丨声学wsi—??L模,J?L?J?由IMM定义??的分词??字典|?|^?^??I???I??声音文件一|?广?^?^?文本文件??麦克风?一一Julius?j一??d?V??7?标准输出??—嵌'、?L■甩务器-吝卢??<?应用程序)?应用程序)??图2-2?Julius与应用程序连接??HTK(HMM?Toolkit)是一个专门用来处理HMM的开源工具包,它主要包??含四部分:数据准备工具、模型训练和优化工具、识别工具和性能评估工具[48]。??毎个工具都可以通过使用命令函数块来对不同功能进行实现。??数据准备工具通过使用HSLab、HLEd、Hcopy等函数帮助用户进行语音录??制、音素标注和声音特征提取等工作。模型训练和优化工具通过使用HcompV函??12??
的??逆过程。一个完整的TTS系统一般由三个模块组成:前端模块、后端模块和声??码器。在有些情况下,会把后端模块和声码器视为一个模块,例如端到端的TTS??系统。TTS技术在语音导航应用、新闻类APP、语音助手中都有应用。??TTS语音合成过程可以简单描述为:首先输入的文本序列先经过文本预处理??后,得到对应的文本特征,这些特征包括基频、时长、节奏、韵律等;然后通过??后端模块中的声学模型将文本特征映射为语音特征,例如语音音素;最后通过声??码器输出语音音频。一个完成的TTS系统如图2-3所示。?????????I?一一一一-^??I前端?!?1后姚?!??!??1?|?I??I??I?I?I??分词??]??j?|?声学横型??!?i?I?????词性标,主?I?^???I—?声码器??————?!?:?!?!?!?I??j?I?I?语音库???I???!????图2-3?TTS系统的基本框架??I)前端模块:前端模块主要负责对输入文本逬行预处理,并获取文本相应的??语言学特征。比如进行词性标注,将一个词语标记成名词或动词。前端模块常见??的操作有:语言鉴别、子句切分、分词、词性预测和韵律预测。一个完整的前端??模块如图2-4所示。??13??
【参考文献】:
期刊论文
[1]2019年趋势观察:AI家庭助手[J]. OVUM;. 电信工程技术与标准化. 2019(03)
[2]人工智能技术在智慧停车领域的实践[J]. 刘源,张玉栋,康雷,吴德东,毛峻岭. 人工智能. 2019(01)
[3]基于人工智能技术的智能音箱发展现状与趋势探究[J]. 王颢毅. 通讯世界. 2018(12)
[4]几种开源英语识别工具包的对比分析[J]. 刘琼. 计算技术与自动化. 2018(04)
[5]语音识别技术的研究进展与展望[J]. 王海坤,潘嘉,刘聪. 电信科学. 2018(02)
[6]2017年中国人工智能行业分析——智能语音应用篇[J]. 刘剑. 湖南工业职业技术学院学报. 2017(03)
[7]语音识别64年大突破[J]. 姜姝姝. 机器人产业. 2016(06)
[8]低信噪比下的端点检测算法研究[J]. 韩芳,靳宗信. 西北师范大学学报(自然科学版). 2016(05)
[9]数据流技术在汽车维修中的应用[J]. 董迎召. 民营科技. 2016(08)
[10]Spring MVC框架开发WEB应用程序的探索与研究[J]. 周燕玲. 科技广场. 2016(06)
硕士论文
[1]新媒体时代我国青年有声读物发展现状及策略研究[D]. 徐佳琳.北京印刷学院 2019
[2]语音识别技术在人机交互中的应用研究[D]. 高雪.北方工业大学 2017
[3]面向轨迹大数据存储及查询的NoSQL数据库研究[D]. 闫密巧.华东师范大学 2017
[4]地铁车辆检修管理系统的设计与实现[D]. 高峰.吉林大学 2016
[5]基于Struts2.0+Spring2.0+Mybatis的质监系统网站设计开发与实现[D]. 李海波.吉林大学 2016
[6]地铁车辆检修调度管理系统的设计与实现[D]. 唐登仕.华南理工大学 2013
[7]地铁车辆检修信息系统的开发[D]. 曾星瑜.西南交通大学 2012
本文编号:3598874
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:106 页
【学位级别】:硕士
【部分图文】:
图2-1?ASR系统框架??1)语音预处理:对输入的语音信号进行预处理工作可以起到消除语音噪声,??
方式在核心实现上并无太大差异,??主要的不同在于:前者通过将Julius作为ASR识别引擎,直接嵌入到系统中,??应用程序通过调用本地Julius实现语音识别;后者需要通过soceket套接字进行??应用交互,依赖于客户端-服务器结构。前者的优点在于:即使在无网络的情况??下,也能进行语音识别。后者的优点在于:将Julius与本地系统直接隔离开,用??户可以在不同地方去分别搭建应用程序,然后通过广域网接入Julius实现语音识??另1J,更加灵活方便。Julius与应用程序连接方式如图2-2所示。??——I?y?T*Lsn ̄ ̄i?——丨声学wsi—??L模,J?L?J?由IMM定义??的分词??字典|?|^?^??I???I??声音文件一|?广?^?^?文本文件??麦克风?一一Julius?j一??d?V??7?标准输出??—嵌'、?L■甩务器-吝卢??<?应用程序)?应用程序)??图2-2?Julius与应用程序连接??HTK(HMM?Toolkit)是一个专门用来处理HMM的开源工具包,它主要包??含四部分:数据准备工具、模型训练和优化工具、识别工具和性能评估工具[48]。??毎个工具都可以通过使用命令函数块来对不同功能进行实现。??数据准备工具通过使用HSLab、HLEd、Hcopy等函数帮助用户进行语音录??制、音素标注和声音特征提取等工作。模型训练和优化工具通过使用HcompV函??12??
的??逆过程。一个完整的TTS系统一般由三个模块组成:前端模块、后端模块和声??码器。在有些情况下,会把后端模块和声码器视为一个模块,例如端到端的TTS??系统。TTS技术在语音导航应用、新闻类APP、语音助手中都有应用。??TTS语音合成过程可以简单描述为:首先输入的文本序列先经过文本预处理??后,得到对应的文本特征,这些特征包括基频、时长、节奏、韵律等;然后通过??后端模块中的声学模型将文本特征映射为语音特征,例如语音音素;最后通过声??码器输出语音音频。一个完成的TTS系统如图2-3所示。?????????I?一一一一-^??I前端?!?1后姚?!??!??1?|?I??I??I?I?I??分词??]??j?|?声学横型??!?i?I?????词性标,主?I?^???I—?声码器??————?!?:?!?!?!?I??j?I?I?语音库???I???!????图2-3?TTS系统的基本框架??I)前端模块:前端模块主要负责对输入文本逬行预处理,并获取文本相应的??语言学特征。比如进行词性标注,将一个词语标记成名词或动词。前端模块常见??的操作有:语言鉴别、子句切分、分词、词性预测和韵律预测。一个完整的前端??模块如图2-4所示。??13??
【参考文献】:
期刊论文
[1]2019年趋势观察:AI家庭助手[J]. OVUM;. 电信工程技术与标准化. 2019(03)
[2]人工智能技术在智慧停车领域的实践[J]. 刘源,张玉栋,康雷,吴德东,毛峻岭. 人工智能. 2019(01)
[3]基于人工智能技术的智能音箱发展现状与趋势探究[J]. 王颢毅. 通讯世界. 2018(12)
[4]几种开源英语识别工具包的对比分析[J]. 刘琼. 计算技术与自动化. 2018(04)
[5]语音识别技术的研究进展与展望[J]. 王海坤,潘嘉,刘聪. 电信科学. 2018(02)
[6]2017年中国人工智能行业分析——智能语音应用篇[J]. 刘剑. 湖南工业职业技术学院学报. 2017(03)
[7]语音识别64年大突破[J]. 姜姝姝. 机器人产业. 2016(06)
[8]低信噪比下的端点检测算法研究[J]. 韩芳,靳宗信. 西北师范大学学报(自然科学版). 2016(05)
[9]数据流技术在汽车维修中的应用[J]. 董迎召. 民营科技. 2016(08)
[10]Spring MVC框架开发WEB应用程序的探索与研究[J]. 周燕玲. 科技广场. 2016(06)
硕士论文
[1]新媒体时代我国青年有声读物发展现状及策略研究[D]. 徐佳琳.北京印刷学院 2019
[2]语音识别技术在人机交互中的应用研究[D]. 高雪.北方工业大学 2017
[3]面向轨迹大数据存储及查询的NoSQL数据库研究[D]. 闫密巧.华东师范大学 2017
[4]地铁车辆检修管理系统的设计与实现[D]. 高峰.吉林大学 2016
[5]基于Struts2.0+Spring2.0+Mybatis的质监系统网站设计开发与实现[D]. 李海波.吉林大学 2016
[6]地铁车辆检修调度管理系统的设计与实现[D]. 唐登仕.华南理工大学 2013
[7]地铁车辆检修信息系统的开发[D]. 曾星瑜.西南交通大学 2012
本文编号:3598874
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3598874.html