当前位置:主页 > 科技论文 > 信息工程论文 >

准书面语朝鲜语语音语料自动标注系统的研究与实现

发布时间:2020-10-08 20:53
   随着人工智能时代的到来,其相关技术呈现了快速发展的趋势。在这样的时代背景下,语音识别技术也越来越广泛地融入人们的生活和生产中,出现了语音输入、语音助手、口语翻译、智能客服、智能硬件等应用性产品。在语音识别技术发展的历程中,每一次识别方法的突破始终离不开高质量、大规模的语音语料库的支撑,所以语音语料库的建设是语音识别技术赖以实现的重要基础。过去的几十年间,我国很多少数民族语言如维吾尔语、藏语、蒙古语的语音语料库建设已初具规模,但国内的朝鲜语语音语料库建设状况却是严重滞后的。针对这一状况,本文结合朝鲜语的发音特点提出了准书面语朝鲜语语音语料的自动标注方法,并设计实现了自动标注系统。首先,基于Seneff听觉模型提出朝鲜语语音音节自动分割方法。该方法依据Seneff听觉模型输出的ALSD和ED等参数确定正负突变点,进而确定语音音节的起止位置。在此基础上进一步分析错误分割主要原因后,提出了改进的朝鲜语语音音节分割算法。其次,提出了准书面语朝鲜语文语语料的文语对齐方法。为了减少语音音节分割错误在文语对齐阶段的累计影响,本方法在文语对齐预处理阶段采用提出的语音句子切分算法和语音片段细切分算法将文语语料划分为一系列更小的语音片段序列,然后在引入提出的朝鲜语连读规则和音节真伪性判别算法基础上实现了文语对齐。最后,设计和实现了准书面语朝鲜语语音语料的自动标注系统。该系统以语音语料自动标注文件作为最终的处理结果,以语音音节自动分割算法和文语对齐方法为核心技术,采用Python编码实现。设计和实现过程中遵循软件工程方法进行了需求分析、总体方案设计、功能模块划分以及测试。实验和测试结果表明,本文提出的音节自动分割改进算法准确率达到86.76%,文语对齐算法准确率达到70.26%,系统的功能模块测试均满足设计目标,未发现缺陷。本文提出的语音语料自动标注方法与人工标注和基于语音识别标注方法不同,主要通过语音音节自动分割和文语对齐方法实现了准书面语朝鲜语文语语料的自动对齐和标注,方法具有简单高效、易实现等优点,同时对促进朝鲜语语音语料库研究与建设具有一定的理论和应用价值。
【学位单位】:延边大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:H219;TN912.3
【部分图文】:

示意图,听觉,人类,临界频带


识别、语音识别、语音信号处理等领域。逡逑Seneff听觉模型的原理是对于耳蜗模型,采用一组线性时不变临界频带逡逑滤波器进行描述。人的外周听觉系统由外耳、中耳、内耳组成,如图2-2所逡逑示。耳蜗内含基底膜和赖斯纳膜,其中基底膜可对输入信号进行频率分析。逡逑Seneff听觉模型主要由临界频带滤波器组、毛细胞模型和输出响应组成[311。逡逑图2-2人类听觉周边的示意图逡逑Fig.2-2邋Schematic邋diagram邋of邋human邋hearing逡逑听觉神经纤维沿着耳蜗基底膜的反应特性可近似由临界频带滤波器组成逡逑的序列表示,不同的方法产生的滤波器响应形状不同,如通过Mossbauer技逡逑术[321或激光干涉法【331测量基底膜的振动得到“神经生理调节曲线”,或通过心逡逑—12邋—逡逑

框架图,听觉模型,框架,快速自动增益控制


2.邋4.邋2基于Seneff听觉模型的特征表示逡逑听觉模型是基于人耳的构造模拟实际耳蜗,所以具备良好的语音处理性逡逑能。Seneff听觉模型框架参见图2-3[34]。逡逑预处理滤波J逡逑临界频带滤波器组逡逑半波整流逡逑逦邋I逡逑「:逦i邋h邋「…:逦i邋 ̄ ̄ ̄i逡逑短时自适应调整+STA邋:逦低通滤波(LPF)逡逑平|逦逦!:逦邋i逦I邋逦^逦邋|邋同逡逑ii邋|快速自动增益控制逦:|快速自动增益控制丨g逡逑象逦(AGC)逦|逦!逦(AGC)逦ig逦I逡逑7逦:逦:逦I邋..逦!逡逑包络检测器逦同步检测器逡逑I邋1邋^邋I邋丨邋r°s’邋I逡逑图2-3邋Seneff听觉模型框架逡逑Fig.2-3邋Seneff邋auditory邋model邋framework逡逑—13邋—逡逑

曲线,语音,特征参数,全频带


LSD、全频带和中高频带ED以及ED谱重心。相关的参数的计算方法参见逡逑2.4.2逦中公式(2-20) ̄(2-23)。逡逑图3-3是朝鲜语语音“夸吩封可嘹舍兮MTL”的频谱参数分布曲线示意逡逑图。图3-3中标注符号“▲”表示波峰,“%肌北硎静ü龋埃北硎菊槐涞悖礤义鲜靖和槐涞恪e义贤迹常持懈髑咄枷允境瞿芰亢凸舱穹宓忍卣骶桑樱澹睿澹妫嫣跄P捅硎惧义铣晌牛暮停粒蹋樱脑诟髌刀蔚牟煌榭觯渲校ǎ幔ǎ猓ǎ洌ǎ瑁┪荡粒蹋樱摹⒌湾义掀荡粒蹋樱摹ⅲ粒蹋樱钠字匦暮停牛闹械透咂荡龋捎糜谇窒煲艉妥枞簦诲义希ǎ猓ǎ澹ǎ妫兀纾┪懈咂荡粒蹋樱摹⑷荡椭懈咂荡耍囊约埃牛钠字匦模馑腻义险咭约叭荡粒蹋樱目啥韵煲艚徊郊觳獬鲈簟⒈且艉捅咭簟S商卣髑咤义锨魇票浠汕蟮谜和槐涞悖诖嘶∩峡墒迪忠艚诒呓绲愕幕帧e义稀玻跺濉义

本文编号:2832743

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2832743.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3f29d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com