面向会议场景的声纹识别技术研究与系统实现
发布时间:2022-10-06 19:56
传统的会议记录方式存在记录时间周期长、记录内容不准确、难以分辨说话人等问题。在机器学习迅速发展的今天,利用机器学习技术改进传统的会议记录方式,并通过对会议语音的智能记录,最终形成准确的会议记录报告。这种新的会议记录方式满足了会议场景下对会议记录的诸多要求,将具有非常大的实用价值与市场竞争力。立足于此,本文采用声纹识别技术实现对会议的智能记录、研究并开发面向会议场景的声纹识别系统,本文工作简述如下:一、研究声纹识别系统的基础理论:首先,研究声纹识别系统的基本概念、发展历史、基本步骤、基本特点;其次,研究声纹识别系统目前的理论研究进展和系统开发进展,为下文提出的两种算法与系统开发提供理论依据和开发指导。二、研究小样本条件下准确声纹识别算法:首先,研究会议场景下小样本训练产生的原因,并分析小样本训练存在的问题;其次,提出新型特征提取方法和基于会议场景模型训练方法用于小样本条件下提高系统识别准确率;再次,将算法融入到声纹识别系统中,并介绍算法的执行流程;最后,对算法的有效性进行验证分析,为小样本条件下实现准确的声纹识别目标提供理论依据和实际开发指导经验。三、研究强噪条件下可靠声纹识别算法:首先...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 声纹识别问题概述
1.2.1 基本概念
1.2.2 发展历史
1.2.3 基本步骤
1.2.4 基本特点
1.3 声纹识别研究综述
1.3.1 相关理论研究进展
1.3.2 相关系统开发进展
1.4 主要工作与内容安排
第二章 小样本条件下准确声纹识别算法
2.1 问题描述
2.2 新型特征提取方法
2.2.1 训练阶段特征提取方法
2.2.2 识别阶段特征提取方法
2.3 基于会议场景模型训练方法
2.3.1 训练会议场景下的UBM
2.3.2 会议场景模型再训练
2.4 算法流程
2.5 实验结果
2.6 本章小结
第三章 强噪条件下可靠声纹识别算法
3.1 问题描述
3.2 新型分类噪声去除方法
3.2.1 双MIC降噪
3.2.2 小波降噪
3.2.3 SOX降噪
3.2.4 PCA降噪
3.3 基于学习补偿的背景噪声去除方法
3.3.1 基于场景的噪声分类
3.3.2 背景噪声估计
3.3.3 噪声补偿
3.4 算法流程
3.5 实验结果
3.6 本章小结
第四章 面向会议场景的智能会议记录系统实现与测试
4.1 需求分析
4.2 系统架构
4.3 系统实现
4.3.1 终端侧模块
4.3.2 通信模块
4.3.3 服务器侧模块
4.4 系统测试
4.4.1 功能测试
4.4.2 性能测试
4.5 本章小结
第五章 总结与展望
5.1 本文总结
5.2 未来展望
参考文献
附录1 攻读硕士学位期间申请的发明专利和软件著作权
附录2 攻读硕士学位期间参加的科研项目
致谢
【参考文献】:
期刊论文
[1]语音识别技术前景广阔[J]. 刘聪,高建清,万根顺,陈怡敏. 高科技与产业化. 2018(03)
[2]基于数据驱动缺失特征检测与重建的声纹识别[J]. 尹海明,王金明,李欢欢. 计算机工程与应用. 2016(22)
[3]基于MATLAB的语音信号采集和语谱图分析[J]. 刘博. 电脑知识与技术. 2015(11)
[4]噪声相关情况下说话人跟踪方法[J]. 李军,曹洁,李伟. 计算机辅助设计与图形学学报. 2014(12)
[5]基于小波语谱图分析的语音去噪技术[J]. 郑党,鲍鸿,张晶. 计算机工程与应用. 2016(04)
[6]声纹识别技术在金刚石压机顶锤防护中的应用[J]. 李炜恒,王林生. 金刚石与磨料磨具工程. 2013(03)
[7]基于自然语言处理的声纹优化识别算法研究[J]. 熊婷,汪伟,张炘. 计算机仿真. 2013(06)
[8]一种基于语谱图分析的语音增强算法[J]. 肖纯智,孙大飞,高勇. 电声技术. 2012(09)
[9]偏相干分析识别噪声源的计算[J]. 赵海澜,汪鸿振. 噪声与振动控制. 2005(05)
[10]声纹识别技术中特征语音参数选取的相关问题[J]. 谷志新,王述洋,田仲富. 林业劳动安全. 2005(02)
硕士论文
[1]声纹识别相关技术研究及应用[D]. 张芝旖.南京航空航天大学 2016
本文编号:3687308
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 声纹识别问题概述
1.2.1 基本概念
1.2.2 发展历史
1.2.3 基本步骤
1.2.4 基本特点
1.3 声纹识别研究综述
1.3.1 相关理论研究进展
1.3.2 相关系统开发进展
1.4 主要工作与内容安排
第二章 小样本条件下准确声纹识别算法
2.1 问题描述
2.2 新型特征提取方法
2.2.1 训练阶段特征提取方法
2.2.2 识别阶段特征提取方法
2.3 基于会议场景模型训练方法
2.3.1 训练会议场景下的UBM
2.3.2 会议场景模型再训练
2.4 算法流程
2.5 实验结果
2.6 本章小结
第三章 强噪条件下可靠声纹识别算法
3.1 问题描述
3.2 新型分类噪声去除方法
3.2.1 双MIC降噪
3.2.2 小波降噪
3.2.3 SOX降噪
3.2.4 PCA降噪
3.3 基于学习补偿的背景噪声去除方法
3.3.1 基于场景的噪声分类
3.3.2 背景噪声估计
3.3.3 噪声补偿
3.4 算法流程
3.5 实验结果
3.6 本章小结
第四章 面向会议场景的智能会议记录系统实现与测试
4.1 需求分析
4.2 系统架构
4.3 系统实现
4.3.1 终端侧模块
4.3.2 通信模块
4.3.3 服务器侧模块
4.4 系统测试
4.4.1 功能测试
4.4.2 性能测试
4.5 本章小结
第五章 总结与展望
5.1 本文总结
5.2 未来展望
参考文献
附录1 攻读硕士学位期间申请的发明专利和软件著作权
附录2 攻读硕士学位期间参加的科研项目
致谢
【参考文献】:
期刊论文
[1]语音识别技术前景广阔[J]. 刘聪,高建清,万根顺,陈怡敏. 高科技与产业化. 2018(03)
[2]基于数据驱动缺失特征检测与重建的声纹识别[J]. 尹海明,王金明,李欢欢. 计算机工程与应用. 2016(22)
[3]基于MATLAB的语音信号采集和语谱图分析[J]. 刘博. 电脑知识与技术. 2015(11)
[4]噪声相关情况下说话人跟踪方法[J]. 李军,曹洁,李伟. 计算机辅助设计与图形学学报. 2014(12)
[5]基于小波语谱图分析的语音去噪技术[J]. 郑党,鲍鸿,张晶. 计算机工程与应用. 2016(04)
[6]声纹识别技术在金刚石压机顶锤防护中的应用[J]. 李炜恒,王林生. 金刚石与磨料磨具工程. 2013(03)
[7]基于自然语言处理的声纹优化识别算法研究[J]. 熊婷,汪伟,张炘. 计算机仿真. 2013(06)
[8]一种基于语谱图分析的语音增强算法[J]. 肖纯智,孙大飞,高勇. 电声技术. 2012(09)
[9]偏相干分析识别噪声源的计算[J]. 赵海澜,汪鸿振. 噪声与振动控制. 2005(05)
[10]声纹识别技术中特征语音参数选取的相关问题[J]. 谷志新,王述洋,田仲富. 林业劳动安全. 2005(02)
硕士论文
[1]声纹识别相关技术研究及应用[D]. 张芝旖.南京航空航天大学 2016
本文编号:3687308
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3687308.html