一种自动等响度数字混音算法
【图文】:
针对上述问题,本文提出一种自动等响度数字混音算法。该算法首先利用信号平均功率和短时自相关函数进行语音活动检测,判断参与混音的每路信号中是否含有语音信号。再利用时变滤波器滤掉不必要的噪声,解决静音检测所导致的会议交流氛围不真实等问题。最后,利用响度计算各路信号的权重,使各路信号的平均响度相同。仿真实验验证了本文算法的有效性。2自动等响度数字混音算法本文算法由语音活动检测、时变滤波、等响度控制等模块组成;等响度控制模块又可分为响度计算、等响度权重计算、混音处理三个部分;整个流程如图1所示。首先,每路信号经过语音活动检测模块判断是否含有语音信号,根据判断结果确定后续时变滤波器的通带宽度;如果当前帧被判断为语音信号,则用DFT变换计算其响度;最后对时变滤波器输出的各路信号进行等响度控制。下面,对各模块进行详细说明。图1混音系统框图Fig.1Blockdiagramofmixedaudiosystem2.1语音活动检测语音活动检测是根据当前帧信号的平均功率和短时自相关函数判断当前帧是否含有语音信号。设VAD表示当前帧是否含有语音信号,,并且VAD赋初始值,使得VAD=1。当前帧功率p可表示为p=1N∑N-1i=0x2[i](1)其中,x[i]表示当前帧第i个输入数据,N表示一帧中的样本数。设当前预定时间段T为当前帧之前第r帧至当前帧的持续时间,pi为当前帧之前第i帧功率,则当前预定时间段内的最小帧功率pmin可表示为pmin=min{p,p1,p2,..,.pi,..,.pr}(2)其中,min{·}表示括号中所有数据的最小值,r=ceilTFSN,这里ceil(x)表示接近x且大于等于x的整数,FS表示采样频率。当满足式(3)时,所述语音活动检测模块将VAD置1。10
第3期呼德等:一种自动等响度数字混音算法2.2时变滤波器时变滤波器根据语音活动检测模块的检测结果,对当前帧信号进行时变低通滤波处理。当某路信号当前帧中含有语音信号时,时变滤波器的通带逐渐变宽;当某路信号当前帧中不含有语音信号时,时变滤波器的通带逐渐变窄。时变滤波器的差分方程为f[i]=(1-b)x[i]+bf[i-1](8)其中,f[i]表示当前帧的第i个滤波输出值,x[i]表示当前帧第i个输入数据,0≤i<N,b是滤波系数。图2幅频响应特性Fig.2Amplitude-Frequencyresponse当采样频率为48kHz,时变滤波器系数b=0.18时,其3dB通带截止频率为20kHz;b=0.956时,其3dB通带截止频率为0.3kHz;如图2所示。根据语音活动检测结果,滤波系数b在0.18~0.956间逐渐变化,从而使得滤波器通带在0.3kHz~20kHz内发生变化。系数b的变化规则如下:当前帧含有语音信号时,则有b=b+0.18-0.956N1(9)其中,当b<0.18,取b=0.18,N1表示b从0.956变至0.18时的采样点数。当前帧不含有语音信号时,则有b=b+0.956-0.18N2(10)其中,当b>0.956,取b=0.956,N2表示b从0.18变至0.956时的采样点数。2.3响度计算响度是指人耳感受到的声音强弱,它是人对声音强度大小的主观感觉量。通常,根据语音活动检测模块的检测结果,计算信号当前预定时间段内的平均响度。当前帧信号处于有语音状态时,首先计算x[i]的DFT变换X[s]=∑N-1i=0x[i]WisN,s=0,1,…,N-1(11)其中,WisN=e-j2!Nis,s表示离散频率,x[i]表示当前帧第i个输入数据,j表示虚数单位。其次,当前帧信号的响度值l可表示为l=1N4-N3(∑N4s=N3X[s]210-Equal?
【作者单位】: 大连理工大学信息与通信工程学院;
【基金】:国家863计划(2015AA016306) 国家自然科学基金(61172107,61172110) 辽宁省科技创新重大专项(201302001) 中央高校基本科研业务费专项资金(DUT13LAB06)
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 春水东流;;找出消失的立体声混音[J];电脑迷;2007年11期
2 姚金财;曲敬珍;;浅谈混音技术[J];音响技术;2010年05期
3 郑斌;;混音小议技术[J];视听纵横;2013年05期
4 任珩;使用超级解霸消除片中混音[J];电脑爱好者;2001年18期
5 徐保民,王秀玲;一个改进的混音算法[J];电子与信息学报;2003年12期
6 王勇;;在线混音调出美妙旋律[J];电脑爱好者(普及版);2007年06期
7 黄梅;洪玫;卢扬;胡元甲;;数字混音模型的设计与实现[J];计算机工程与设计;2010年16期
8 刘泉 ,张小麟 ,刘新华;自适应数字混音算法的研究与应用[J];微计算机信息;2005年20期
9 谢韦华;;关于调音台混音减功能的分析和应用[J];影视制作;2010年08期
10 秦梓元;;浅谈多轨录音、混音的空间设计及声场塑造[J];音乐大观;2012年07期
相关会议论文 前1条
1 林涛;;专业多轨录音/混音软件——Nuendo[A];2005年广播电视技术论文汇编[C];2005年
相关重要报纸文章 前2条
1 山东 张栋;自己作DJ,酷[N];电脑报;2003年
2 ;音乐文件的编辑、混音及修复[N];中国国门时报;2006年
相关硕士学位论文 前10条
1 谭超;多中心应急通信系统关键技术研究[D];天津大学;2014年
2 赵一潼;行动中的混音思维-“再造性”艺术理念[D];上海音乐学院;2016年
3 陈申;论数字与模拟混音平台的音质差异性[D];上海音乐学院;2012年
4 韩钰;网络电话会议中混音技术的研究[D];河南科技大学;2010年
5 江淼;当代节奏布鲁斯歌曲的混音艺术与技术研究[D];中央音乐学院;2014年
6 孙进宝;基于WebRTC的混音服务器的研究与设计[D];西安电子科技大学;2014年
7 刘文;嵌入式Linux环境下多路音频流混音设备的研究与设计[D];河北农业大学;2014年
8 黑利利;录音、混音室建筑声学特性研究[D];长安大学;2013年
9 王亚辉;基于WebRTC语音引擎的会议混音技术研究[D];西安电子科技大学;2013年
10 张传永;混音技术及其在IP电话会议系统中的应用[D];西安电子科技大学;2011年
本文编号:2537756
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2537756.html