有限词汇的说话人识别技术
本文关键词:有限词汇的说话人识别技术
【摘要】:说话人识别技术是根据对输入音频的分析,提取说话人的特征信息,利用该信息自动进行身份的认证。作为生物认证技术的一种,说话人识别技术解决了隐私信息危机化的问题。同时说话人识别技术实现简单、操作方便、音频录入处理简单,而使得该技术在现实生活中存在很多用途。人口老龄化问题的日益凸出,随之需要发展的是老年人产业。老年人产品用以解决老年人生活中遇到的问题。将说话人识别技术应用于产品中,进一步提高了产品的安全性。以对传统的特征提取算法和模式识别算法的学习为基础,通过对现有改进算法的研究,提出了基于熵值加权的MFCC算法和基于谱聚类初始化的EM算法。构建了特殊的语言数据库用来测试算法的性能。最后设计了一款老年便携手持设备,并将说话人识别技术应用于其中,进一步提高了设备的安全性。并且搭建了手持设备的软件测试平台。
【关键词】:说话人识别 人口老龄化 熵值加权 模式识别
【学位授予单位】:天津财经大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 内容摘要5-6
- Abstract6-10
- 第1章 绪论10-14
- 1.1 说话人识别技术的发展与现状10-11
- 1.1.1 说话人识别技术的概念10
- 1.1.2 说话人识别技术的发展与现状10-11
- 1.2 论文研究意义11-12
- 1.3 论文研究路线12
- 1.4 本文内容及安排12-14
- 第2章 说话人识别技术算法14-24
- 2.1 说话人识别技术原理14
- 2.2 特征值提取算法14-18
- 2.2.1 Mel频率倒谱系数(MFCC)15
- 2.2.2 感知线性预测系数(PLP)15-17
- 2.2.3 线性预测系数(LPC)17-18
- 2.3 模式识别算法18-22
- 2.3.1 HMM18-19
- 2.3.2 VQ19-20
- 2.3.3 SVM20-21
- 2.3.4 GMM21-22
- 2.4 说话人识别系统文献综述22-24
- 第3章 MFCC提取算法的改进24-35
- 3.1 特征值提取算法的理论基础24-26
- 3.1.1 语音信号处理24-25
- 3.1.2 MFCC提取技术25
- 3.1.3 熵值赋权算法25-26
- 3.2 基于熵值法加权的MFCC26-33
- 3.2.1 预处理27-29
- 3.2.2 快速傅立叶变换(FFT)29-30
- 3.2.3 Mel频率滤波器组30
- 3.2.4 对数与余弦变换30-31
- 3.2.5 MFCC一阶差分和二阶差分的计算31-32
- 3.2.6 MFCC特征参数矩阵的标准化32
- 3.2.7 根据标准化后的MFCC"计算熵值32
- 3.2.8 确定权重32-33
- 3.3 各维分量权重的分析33-34
- 3.4 本章小结34-35
- 第4章 EM算法的改进35-40
- 4.1 高斯混合模型GMM35-36
- 4.2 EM算法的介绍36-37
- 4.3. 基于谱聚类初始化的EM算法37-39
- 4.3.1 谱聚类38
- 4.3.2 EM初始化方法的比较38-39
- 4.4 本章小结39-40
- 第5章 说话人识别系统40-47
- 5.1 语音数据库40-41
- 5.2 系统描述41-44
- 5.3 系统仿真实验分析44-46
- 5.3.1 特征值不同维数下错误接受率的比较44
- 5.3.2 不同训练模型下错误接受率的比较44-45
- 5.3.3 不同阈值下系统错误接受率与错误拒绝率的比较45-46
- 5.4 本章小结46-47
- 第6章 基于说话人识别的老年便携手持设备47-62
- 6.1 手持设备的设计背景与原则47-50
- 6.1.1 老年便携手持设备设计背景47-49
- 6.1.2 老年便携手持设备设计原则49-50
- 6.2 手持设备的设计意图50
- 6.3 手持设备硬件组成介绍50-51
- 6.4 手持设备功能模块51-53
- 6.5 手持设备关键技术分析53-56
- 6.5.1 说话人识别技术54
- 6.5.2 音频检索技术54-56
- 6.6 手持设备软件测试系统的设计56-61
- 6.7 本章小结61-62
- 第7章 结论与展望62-64
- 7.1 结论62-63
- 7.2 展望63-64
- 参考文献64-69
- 后记69
【相似文献】
中国期刊全文数据库 前10条
1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期
2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期
4 单进;;说话人识别技术研究[J];科技资讯;2010年21期
5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期
6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期
8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期
9 武光利;;说话人识别方法概述[J];硅谷;2012年19期
10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期
中国重要会议论文全文数据库 前10条
1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年
中国重要报纸全文数据库 前2条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
3 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年
4 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
5 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
6 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
7 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
8 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
9 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
10 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
中国硕士学位论文全文数据库 前10条
1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年
3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年
4 汪q,
本文编号:1042990
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1042990.html