当前位置:主页 > 科技论文 > 信息工程论文 >

基于语音信号处理的呼吸认证方法研究

发布时间:2018-10-09 08:20
【摘要】:说话人识别是一类基础问题,该问题可以细分为两类:说话人辨别问题和说话人确认问题。根据对语音文本的依赖程度不同,说话人识别又分为文本相关型、文本无关型、文本提示型。识别说话人包括训练/登记和测试/验证两个阶段,训练阶段建立合法说话人(即目标说话人)特征模板,测试阶段则计算待识别说话人的测试语音数据与合法说话人特征模板的相似度,并得出判断结果。在最近20多年的研究中,说话人识别普遍关注语音信号的音源,发音系统,韵律特征。而语音中的呼吸信号在研究中并没有受到关注,甚至将其作为噪音项进行剔除。通过本文的观察和研究发现,呼吸信号具有其独特性,是呼吸系统意义上的生理指纹。它是人体自然而然产生的,持续时间短,发生频率低且处理简单,呼吸特征是人体与生俱来的,具有唯一,稳定的特点。基于呼吸信号的这些特点,本文提出了一种基于呼吸特征的说话人识别方案—“BreathID”,它具有文识别准确率高、文本无关、轻量级且可实现对用户透明的优点。“Breath ID”分为3个部分:呼吸边界分离,特征提取和选择,特征匹配。本文通过CDF统计分析和实证研究,选择梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,简称MFCC)作为说话人的呼吸特征。文中提出了基于一组简单向量操作的轻量级的分类算法,最后通过该分类算法进行相似度匹配,做出说话人决策。“Breath ID”的实验分为两个部分,第一部分是对50个用户收集数据进行实验,评估“BreathID”的总体性能。实验结果如下:说话人辨别实验中,方案的错误辨别率(False Identification Rate:简称FIR)为0.04%;说话人确认实验中,方案的错误接受率(False Acceptance Rate:简称FAR)为0.12%,错误拒绝率(False Rejection Rate:简称FAR)为0.15%。第二部分通过另外20个用户的数据在不同的实用场景中对“BreathID”的一致性进行评估,包括文本无关性,用户状态(静坐和走路),录音设备(3个智能手机和2个商业麦克风),录音周期(8个月),语言(中文和英文),攻击(重放攻击)。
[Abstract]:Speaker recognition is a basic problem, which can be subdivided into two categories: speaker identification problem and speaker confirmation problem. According to the different degree of dependence on phonetic text, speaker recognition can be divided into text correlation type, text independent type and text prompt type. The identification of the speaker consists of two stages: training / registration and testing / verification. In the training stage, the legal speaker (i.e. the target speaker) feature template is established. In the testing stage, the similarity between the test speech data and the legal speaker feature template is calculated, and the judgment results are obtained. In the past 20 years, speaker recognition has focused on phonetic sources, pronunciation systems and prosodic features of speech signals. However, the respiratory signals in speech have not been paid attention to, and even eliminated as noise terms. It is found that respiratory signals are unique and physiological fingerprints in the sense of respiratory system. It is naturally produced by the human body, with short duration, low frequency of occurrence and simple handling. The breathing characteristics are inherent to the human body and have unique and stable characteristics. Based on these characteristics of respiratory signals, this paper proposes a speaker recognition scheme based on respiratory characteristics, called "BreathID", which has the advantages of high accuracy of text recognition and text independence. "Breath ID" is divided into three parts: respiratory boundary separation, feature extraction and selection, and feature matching. Based on CDF statistical analysis and empirical study, Mel frequency cepstrum coefficient (Mel Frequency Cepstral Coefficients, (MFCC) is chosen as the breathing feature of the speaker. In this paper, a lightweight classification algorithm based on a set of simple vector operations is proposed. Finally, the classification algorithm is used to match the similarity and make the speaker decision. The experiment of "Breath ID" is divided into two parts. The first part is an experiment of 50 users collecting data to evaluate the overall performance of BreathID. The experimental results are as follows: in the speaker discrimination experiment, the error discrimination rate (False Identification Rate:) of the scheme is 0.04, the error acceptance rate (FAR) of the scheme is 0.12 and the error rejection rate (FAR) is 0.15. The second part evaluates the consistency of "BreathID" in different practical scenarios using data from another 20 users, including text independence. User status (sit-in and walk), recording device (3 smartphones and 2 commercial microphones), recording cycle (8 months), language (Chinese and English), attack (replay attack).
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 刘文举,孙兵,钟秋海;基于说话人分类技术的分级说话人识别研究[J];电子学报;2005年07期

2 丁辉;唐振民;钱博;李燕萍;;易扩展小样本环境说话人辨认系统的研究[J];系统仿真学报;2008年10期

3 刘明辉;黄中伟;熊继平;;用于说话人辨识的评分规整[J];计算机工程与应用;2010年12期

4 陈雪芳;杨继臣;;一种三层判决的说话人索引算法[J];计算机工程;2012年02期

5 杨继臣;何俊;李艳雄;;一种基于性别的说话人索引算法[J];计算机工程与科学;2012年06期

6 何致远,胡起秀,徐光yP;两级决策的开集说话人辨认方法[J];清华大学学报(自然科学版);2003年04期

7 殷启新,韩春光,杨鉴;基于掌上电脑录音的说话人辨认[J];云南民族学院学报(自然科学版);2003年04期

8 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期

9 董明,刘加,刘润生;快速口音自适应的动态说话人选择性训练[J];清华大学学报(自然科学版);2005年07期

10 曹敏;王浩川;;说话人自动识别技术研究[J];中州大学学报;2007年02期

相关会议论文 前10条

1 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年

2 金乃高;侯刚;王学辉;李非墨;;基于主动感知的音视频联合说话人跟踪方法[A];2010年通信理论与信号处理学术年会论文集[C];2010年

3 马勇;鲍长春;夏丙寅;;基于辨别性深度信念网络的说话人分割[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

4 白俊梅;张树武;徐波;;广播电视中的目标说话人跟踪技术[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 索宏彬;刘晓星;;基于高斯混合模型的说话人跟踪系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年

6 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年

7 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认快速算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 李经伟;;语体转换与角色定位[A];全国语言与符号学研究会第五届研讨会论文摘要集[C];2002年

9 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年

10 何磊;方棣棠;吴文虎;;说话人聚类与模型自适应结合的说话人自适应方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

相关重要报纸文章 前4条

1 ;做一名积极的倾听者[N];中国纺织报;2003年

2 唐志强;不听别人说话,也能模仿其口音[N];新华每日电讯;2010年

3 黄惠慧(南京师范大学附属扬子中学);高考听力要求及对策[N];中国教育资讯报;2002年

4 西安邮电学院 王娜;企业IP电话解决方案探讨[N];通信信息报;2005年

相关博士学位论文 前10条

1 李洪儒;语句中的说话人形象[D];黑龙江大学;2003年

2 李威;多人会话语音中的说话人角色分析[D];华南理工大学;2015年

3 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年

4 郑建炜;基于核方法的说话人辨认模型研究[D];浙江工业大学;2010年

5 吕声;说话人转换方法的研究[D];华南理工大学;2004年

6 陈凌辉;说话人转换建模方法研究[D];中国科学技术大学;2013年

7 玄成君;基于语音频率特性抑制音素影响的说话人特征提取[D];天津大学;2014年

8 李燕萍;说话人辨认中的特征参数提取和鲁棒性技术研究[D];南京理工大学;2009年

9 徐利敏;说话人辨认中的特征变换和鲁棒性技术研究[D];南京理工大学;2008年

10 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年

相关硕士学位论文 前10条

1 刘玲霜;基于语音信号处理的呼吸认证方法研究[D];电子科技大学;2017年

2 杨浩;基于广义音素的文本无关说话人认证的研究[D];北京邮电大学;2008年

3 史梦洁;构式“没有比X更Y的(了)”研究[D];上海师范大学;2015年

4 魏君;“说你什么好”的多角度研究[D];河北大学;2015年

5 解冬悦;互动韵律:英语多人冲突性话语中说话人的首音模式研究[D];大连外国语大学;2015年

6 朱韦巍;扬州街上话语气词研究[D];南京林业大学;2015年

7 蒋博;特定目标说话人的语音转换系统设计[D];电子科技大学;2015年

8 王雅丹;汉语反语研究[D];南昌大学;2015年

9 陈雨莺;基于EMD的说话人特征参数提取方法研究[D];湘潭大学;2015年

10 单燕燕;变音环境下鲁棒性说话人辨认关键技术研究[D];南京邮电大学;2015年



本文编号:2258639

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2258639.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4b238***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com