基于设备源信息的数字语音取证技术研究
发布时间:2018-05-18 21:19
本文选题:数字语音盲取证 + 录音设备源取证 ; 参考:《华南理工大学》2016年博士论文
【摘要】:数字音频盲取证作为数字多媒体取证的重要组成部分,近年来日益受到关注,而现实中数字音频取证更多的是以数字语音取证的形式出现。目前在数字多媒体取证领域,基于设备源信息的数字图像取证已经得到了充分的发展,相对来说,基于录音设备源信息的数字音频取证的研究还处于起步阶段,有待进一步的发展。因此,本文以基于设备源信息的数字语音盲取证作为研究对象,从以下几个方面开展了工作并做出贡献。1)录制了一个包含15个手机单元的手机音库,称之为SCUTPHONE。同时还构建了一个含有4类录音设备22个录音设备单元的多类型设备音库。上述两个音库中男女声数量相等,每个录音设备单元包含240句语音录音,每句录音近似3秒长。同时,针对数字音频取证领域新近出现的基于语音录音的手机辨认问题,提出了一种基于高斯混合模型-通用背景模型(GMM-UBM)的手机源辨认系统。MFCCs被用来作为表征录音设备单元的特征,在一个手机音库上取得了比基于VQ和线性SVM的系统更高的辨认正确率。此外,还比较了MFCCs特征以及新近提出的含有去噪功能的幂归一化倒谱系数(Power-Normalized Cespstral Coefficients,PNCCs)特征对手机源辨认的性能,并探索性地研究了PNCCs特征提取过程中的各项处理对性能的影响。2)针对目前录音设备源识别的研究主要集中于设备源辨认问题而几乎没有针对设备源确认问题的现状,同时受到基于稀疏表示的分类(Sparse Representation-based Classification,SRC)的强大分类能力的激励,提出了一种新的基于稀疏表示的录音设备源确认框架。在提出了基于样本字典和无监督学习字典(具体为K-SVD)的相应方法后,又利用字典学习领域后续出现的区分性字典学习同时考虑表示能力和区分能力的特点,提出了一种新的基于区分性K-SVD(Discriminative K-SVD,D-KSVD)的设备源确认方法。整个过程分为两个阶段,首先对每一个录音设备训练一个D-KSVD字典,并将训练得到的参数(包括字典和线性分类器)来作为这个设备的模型,在第二个阶段,给定一个语音录音和所声称的录音设备,基于之前训练好的模型来进行设备源确认,提出利用线性分类器的输出来作为评分度量。实验表明新提出的基于D-KSVD的系统较其他两种基于稀疏表示的确认系统以及两种基线系统取得了最好的性能。3)在基于录音设备源的数字语音取证中,有时候录音设备是不可得的,能获取到的可能仅仅有语音录音样本。为此,本文定义和提出了一个在数字语音取证领域有现实意义的新问题:基于语音录音的设备源匹配问题,同时提出了一种新的基于稀疏表示和马氏距离度量学习KISS metric的录音设备源匹配方案:首先对待匹配的两段语音录音中的每一段都提取表征设备特征的高斯超向量,然后利用稀疏表示的区分能力基于高斯超向量进一步提取设备特征,接着对两个设备特征基于正则平滑的KISS metric(Regularized Smoothing KISS metric,RS-KISS metric)进行相似度匹配并与预先设定的门限值相比较做出其是否来自同一个录音设备的判决。实验证明了该方案的有效性。4)通过对录音设备的内部信号处理过程进行分析,发现在录音过程中,传声器、传输电路和A/D转换器都在语音录音中留下了其固有噪声的痕迹,称其为录音设备噪声并提出了一种新的基于录音设备噪声的录音设备指纹。具体来说,对每个待处理的录音设备,为获取其录音设备噪声,利用噪声估计算法来对该设备的多段语音录音进行噪声谱估计然后取平均。此外,为了对设备噪声进行充分的估计,同时考虑了两种噪声估计方法并进行了组合。在两个音库上的设备源辨认实验证明设备噪声特征比其他相关文献中使用的几种特征取得了更高的性能。5)针对录音设备源取证领域新近出现的从语音录音中进行盲信道估计,然后利用估计出的信道信息来表征录音设备的方法,首先提出了两种改进的盲信道估计方法。受到对数美尔谱系数(Logarithmic Mel-spectral Coefficients,LMSCs)和MFCCs在信道识别问题中所表现出的一定的互补特性的驱动,提出了一种基于联合谱聚类的盲信道幅度响应估计方法:基于两种特征分别进行一次谱聚类得到相应的纯净语音谱估计,最终的纯净语音谱估计是这两个谱聚类结果的一个折衷。此外,语音信号频谱的高频部分比低频部分更具有随机性,因此可以利用更精确的多窗谱估计(Multi-window Spectral Estimation,MWSE)来处理高频部分,从而减少高频部分谱估计的方差,为此提出了另一种新的改进的方法,称为双带盲信道估计方法:将语音录音通过一个截止频率划分成高低频部分分别进行盲信道估计,低频部分按照原始的方法采用FFT进行谱估计并提取RASTA-MFCCs进行盲信道估计,而高频部分则通过MWSE进行谱估计并提取MFCCs进行盲信道估计,最后将高低频部分得到的估计谱组合在一起得到最终的信道幅度谱估计。实验表明两种改进的方法较改进前都进一步提升了信道幅度谱估计的准确度。在得到了信道幅度谱估计之后,基于信道幅度谱以及原始语音录音信号幅度谱构建了表征录音设备的特征并应用于录音设备源取证中。在针对37个录音设备单元的设备源辨认实验表明了基于新的盲信道估计方法所提取的信道特征的有效性。
[Abstract]:This paper presents a new recognition system for mobile phones based on the information of equipment source . In order to estimate the noise of the equipment , a new method for estimating the amplitude response of blind channel based on joint spectral clustering is proposed .
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 赵永在;谈大型会议录音设备的配置[J];音响技术;2003年03期
2 王志锋;贺前华;李艳雄;;录音设备的建模和识别算法[J];信号处理;2013年04期
3 董琪;专业电话录音设备的发展与选用[J];电力系统通信;1997年06期
4 ;下一代录音设备[J];个人电脑;1999年05期
5 ;AKG K24P/K26P耳机[J];视听技术;2006年12期
6 蔡映朵;;《中国合伙人》三大主创借助手机、录音设备苦学英语[J];消费电子;2013年11期
7 赵明;;影响录音效果的主客观因素[J];美与时代(上半月);2008年03期
8 朱国辉;;同期录音的设备选配及录音技巧[J];音响技术;2007年02期
9 ;symbian小软件 大作用——重要通话 一键录音[J];电脑爱好者;2011年07期
10 吴龙章;裘洲龙;;CD唱机[J];实用无线电;1994年04期
相关博士学位论文 前1条
1 邹领;基于设备源信息的数字语音取证技术研究[D];华南理工大学;2016年
相关硕士学位论文 前2条
1 李秋实;基于机车无线网的专用录音设备设计与实现[D];郑州大学;2016年
2 胡冰心;录音设备音质评价系统的研究[D];北京化工大学;2015年
,本文编号:1907250
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1907250.html