基于深度学习的声纹识别算法研究
发布时间:2021-09-24 16:13
现代科技的发展和人工智能的崛起,为生活带来了史无前例的便捷性,尤其是生物特征识别技术的使用已经和个人的生活息息相关。但这类基于生物特征的技术,例如指纹识别和虹膜识别,存在易被盗取或使用场景受限的问题,而声纹作为语音中能够表示说话人身份信息的特征,具有变化性和不易伪造性,可以有效避免上述问题出现在声纹识别技术的实际使用中。声纹识别是根据待识别语音中的声纹特征来辨别说话人身份的过程。按照任务的不同,声纹识别可以分为声纹辨认和声纹确认;再根据是否对语音文本内容做限定,又可以分为有文本的声纹识别和无文本的声纹识别。本文是针对研究难度较大的无文本声纹识别中存在的问题进行研究,主要工作如下:(1)针对MFCC特征或者Fbank特征在深度模型中使用会导致模型性能下降的问题,采用语音信号的声谱图或者对数能量声谱图作为模型的输入。声谱图可以较为完整的保留说话人语音中的身份信息,充分激发神经网络的学习潜力;对数能量声谱图不仅具有上述优势,还可以提高模型的抗噪性,为模型能够提取到更具分辨性的深度特征奠定良好的基础。(2)改变语音预处理方式可以获得更精确的特征,但无法在特征空间中增强不同类别之间的区分性,针对...
【文章来源】:河北大学河北省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
汉明窗
声谱图
Filter-bank特征
【参考文献】:
期刊论文
[1]深度神经网络模型压缩方法与进展[J]. 赖叶静,郝珊锋,黄定江. 华东师范大学学报(自然科学版). 2020(05)
[2]深度学习框架下说话人识别研究综述[J]. 曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪. 计算机工程与应用. 2020(07)
[3]深度单峰梯形神经网络[J]. 单传辉. 计算机工程与应用. 2018(23)
[4]噪声环境下稳健的说话人识别特征研究[J]. 程小伟,王健,曾庆宁,谢先明,龙超. 声学技术. 2017(05)
[5]感知听觉场景分析的说话人识别[J]. 吴迪,陶智,张晓俊,周燕,潘欣裕,肖仲喆,赵鹤鸣. 声学学报. 2016(02)
[6]几种人体生物特征的生物识别技术比较[J]. 吴作好,曾洁,邹娟,杨晓东,张尧. 现代电子技术. 2007(14)
[7]人脸识别研究综述[J]. 肖冰,王映辉. 计算机应用研究. 2005(08)
硕士论文
[1]基于发音动作参数的说话人确认技术研究[D]. 张艳.上海师范大学 2018
本文编号:3408056
【文章来源】:河北大学河北省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
汉明窗
声谱图
Filter-bank特征
【参考文献】:
期刊论文
[1]深度神经网络模型压缩方法与进展[J]. 赖叶静,郝珊锋,黄定江. 华东师范大学学报(自然科学版). 2020(05)
[2]深度学习框架下说话人识别研究综述[J]. 曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪. 计算机工程与应用. 2020(07)
[3]深度单峰梯形神经网络[J]. 单传辉. 计算机工程与应用. 2018(23)
[4]噪声环境下稳健的说话人识别特征研究[J]. 程小伟,王健,曾庆宁,谢先明,龙超. 声学技术. 2017(05)
[5]感知听觉场景分析的说话人识别[J]. 吴迪,陶智,张晓俊,周燕,潘欣裕,肖仲喆,赵鹤鸣. 声学学报. 2016(02)
[6]几种人体生物特征的生物识别技术比较[J]. 吴作好,曾洁,邹娟,杨晓东,张尧. 现代电子技术. 2007(14)
[7]人脸识别研究综述[J]. 肖冰,王映辉. 计算机应用研究. 2005(08)
硕士论文
[1]基于发音动作参数的说话人确认技术研究[D]. 张艳.上海师范大学 2018
本文编号:3408056
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3408056.html