基于语音静音段特征的手机来源识别方法
文内图片:
图片说明: ·105·电信科学2017年第7期2.1静音段估计本文采用端点检测技术对静音段进行估计,选择自适应端点检测算法[18]进行静音段的提龋其过程为先求原始信号的MFCC,再采用谱减法进行去噪,增大语音段和静音段的能量对比。在此基础上对所有帧能量由低到高进行排序,寻找一个固定的百分比,对语音段帧和静音段帧加标签,然后利用这些帧的MFCC训练语音段模型和静音段模型,最后用训练模型对所有帧加标签。由图1(a)和图1(b)可知,该方法[16]能较好地区分语音段和静音段,但从合并后的静音段来看,如图1(c)所示,在原始信号语音段和静音段的交界处,还残留少量语音信息,为了进一步消除不必要的语音信息,本文使用函数ns(·)对静音段进行后处理,即:nss(j)=ns(find(|ns(i)|<5×Thr))(1)其中,Thr是ns(i)升序排列后前40%的样本的均值,find(·)的功能是当ns(i)的绝对值小于5倍的Thr时,定位和输出ns(i)的位置,最后通过拼接得到处理后的静音段信号,如图1(d)所示,可以看出本文所修改的端点检测算法能够更好地提取语音的静音段部分。2.2特征提取在语音识别研究中大部分的特征集都是从信号频谱中提取的,其中MFCC特征是应用最广泛的特征之一,在参考文献[13]中将以MFCC特征作为设备的分类特征,,用于实现语音信号的录音设备来源识别。MFCC特征提取具体流程如图2所示。图2MFCC特征提取流程如第1节所述MFC特征含有MFCC特征所欠缺的高频谱信息和能量值之间的相关性信息,而上述信息可成为手机来源识别的分类特征,因此本文将MFCC特征提取流程中DCT之前所得的语音特征信息(MFC特征)作为手机来源识别的分类特征。另外由于语音信号的内容和说话人信息等与录音设备来源识别无关,因此本文通过获取静音段部分的M
文内图片:
图片说明: ind(|ns(i)|<5×Thr))(1)其中,Thr是ns(i)升序排列后前40%的样本的均值,find(·)的功能是当ns(i)的绝对值小于5倍的Thr时,定位和输出ns(i)的位置,最后通过拼接得到处理后的静音段信号,如图1(d)所示,可以看出本文所修改的端点检测算法能够更好地提取语音的静音段部分。2.2特征提取在语音识别研究中大部分的特征集都是从信号频谱中提取的,其中MFCC特征是应用最广泛的特征之一,在参考文献[13]中将以MFCC特征作为设备的分类特征,用于实现语音信号的录音设备来源识别。MFCC特征提取具体流程如图2所示。图2MFCC特征提取流程如第1节所述MFC特征含有MFCC特征所欠缺的高频谱信息和能量值之间的相关性信息,而上述信息可成为手机来源识别的分类特征,因此本文将MFCC特征提取流程中DCT之前所得的语音特征信息(MFC特征)作为手机来源识别的分类特征。另外由于语音信号的内容和说话人信息等与录音设备来源识别无关,因此本文通过获取静音段部分的MFC特征进行录音设备来源识别,以减少语音内容、说话人情感等不相关因素对识别系统的干扰。MFC特征提取流程如下。首先是将第2.1节所得的静音段信号通过一个高通滤波器进行预加重,即:1H(Z)1z=μ(2)图1基于自适应端点检测和后处理操作的静音段估计2017123-3
【作者单位】: 宁波大学信息科学与工程学院;
【基金】:国家自然科学基金资助项目(No.61672302,No.61300055) 浙江省自然科学基金资助项目(No.LZ15F020002,No.LY17F020010) 宁波大学科研基金资助项目(No.XKXL1405,No.XKXL1420,No.XKXL1509,No.XKXL1503);宁波大学王宽诚幸福基金资助项目~~
【分类号】:TN912.34
【参考文献】
相关期刊论文 前9条
1 卿斯汉;;Android安全的研究现状与展望[J];电信科学;2016年10期
2 王波;杨福龙;;数字图像来源取证现状与趋势[J];信息安全研究;2016年06期
3 何振红;;基于特征加权FDCT和模糊最小二乘支持向量机的虹膜识别算法[J];电信科学;2016年03期
4 卢卫;陆希玉;;4G时代移动互联网的发展趋势[J];电信科学;2014年05期
5 贺前华;王志锋;Alexander I Rudnicky;朱铮宇;李新超;;基于改进PNCC特征和两步区分性训练的录音设备识别方法[J];电子学报;2014年01期
6 杨锐;骆伟祺;黄继武;;多媒体取证[J];中国科学:信息科学;2013年12期
7 王志锋;贺前华;李艳雄;;录音设备的建模和识别算法[J];信号处理;2013年04期
8 周翠娟;周治平;;基于模式噪声大分量的手机相机来源检测[J];计算机工程;2013年03期
9 胡永健;简超;俞兵华;;利用彩色图像信息的源相机辨识策略[J];计算机应用;2010年10期
【共引文献】
相关期刊论文 前10条
1 裴安山;王让定;严迪群;;基于语音静音段特征的手机来源识别方法[J];电信科学;2017年07期
2 黄小光;董俊华;王丰;汪伟;;基于Monte-Carlo仿真的4G网络感知规划方法[J];电信科学;2017年07期
3 王彦青;王瀚辰;;一种识别骚扰电话的组合算法研究[J];电信科学;2017年07期
4 蒋明琳;林晓伟;;产业互联网驱动下农产品物流研究新进展[J];商业经济研究;2017年13期
5 邓旭;;PTN网络架构中L2转L3设置方案[J];电信科学;2017年06期
6 邱巍;吴倩;吴海;;基于IMS网络的核心网能力开放部署方式[J];电信科学;2017年04期
7 林森;徐天扬;王颖;;基于Gabor小波和NBP算法的手掌静脉识别[J];激光与光电子学进展;2017年05期
8 姚晔;胡伟通;任一支;;视频目标移除篡改的被动取证[J];网络与信息安全学报;2017年02期
9 裴安山;王让定;严迪群;;基于设备本底噪声频谱特征的手机来源识别[J];电信科学;2017年01期
10 王伟;曾凤;汤敏;陈俊杰;李洪均;;数字图像反取证技术综述[J];中国图象图形学报;2016年12期
【二级参考文献】
相关期刊论文 前10条
1 卿斯汉;;Android安全研究进展[J];软件学报;2016年01期
2 杨弘;周治平;;数字图像模式噪声篡改反取证[J];计算机工程与应用;2014年18期
3 黄海峰;;新技术应用 带来网络安全新隐患[J];通信世界;2013年26期
4 屠要峰;黄震江;;中兴通讯移动互联网业务平台及应用实践[J];通讯世界;2013年01期
5 罗忠亮;段琢华;;基于Curvelet变换的虹膜识别[J];武汉理工大学学报;2012年08期
6 张东方;蒋建中;张连海;;一种基于语音和噪声统计信息改进相位估计的语音增强算法[J];信号处理;2012年04期
7 钟巍;孔祥维;尤新刚;王波;;基于态函数的离散分数余弦倒谱变换在取证话音信息隐藏中的应用[J];电子学报;2012年03期
8 王波;孔祥维;尤新刚;;利用颜色滤波矩阵估计原图的拼接定位盲取证方法[J];电子与信息学报;2012年01期
9 周宇欢;张雄伟;付强;徐鑫;王金明;;多分形谱簇研究及其在说话人识别中的应用[J];信号处理;2011年12期
10 王志锋;贺前华;张雪源;罗海宇;苏卓生;;基于信道模式噪声的录音回放攻击检测[J];华南理工大学学报(自然科学版);2011年10期
【相似文献】
相关期刊论文 前1条
1 Par Henri Frei ,王力;书评——MONOSYLLABISME ET POLYSYLLABISME DANS LES EMPRUNTS LINGUISTIQUES,AVEC UN INVENTAIRE DES PHONEMES DE PEKIN ET DE TOKIO.[J];清华大学学报(自然科学版);1937年02期
相关会议论文 前1条
1 张璐;;An Analysis of Beijing Mandarin Vocalic and Consonantal Segments under Dependency Phonology[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
本文编号:2515348
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2515348.html