基于LPC倒谱特征融合的法庭说话人识别方法
发布时间:2021-04-17 01:59
为了探究辅音与元音LPC倒谱特征融合后对法庭说话人识别性能的影响,对汉语普通话中辅音/s/与元音/i/的LPC倒谱特征进行了特征融合,并使用逻辑回归方法对特征融合后的系统输出得分进行校正,同时在似然比框架内基于该融合特征进行了说话人识别的性能测试。结果表明,相对辅音/s/而言,元音/i/的LPC倒谱特征的识别性能更优,特征融合后的系统识别性能比单一使用/s/和/i/的LPC倒谱特征识别时有较大提升。LPC倒谱特征融合在提升说话人识别性能方面具备应用潜力。
【文章来源】:中国刑警学院学报. 2020,(05)
【文章页数】:5 页
【部分图文】:
0~4k Hz频带范围内利用/s/LPC倒谱特征进行说话人识别的Tippett图
图1 0~4k Hz频带范围内利用/s/LPC倒谱特征进行说话人识别的Tippett图表2的结果表明,元音/i/的LPC倒谱特征说话人识别性能明显优于擦音/s/,尤其是在0~4k Hz的信号频带范围内,系统的Cllr值为0.61,相比于擦音/s/识别性能高出29%,提升了近三分之一,EER值降低了38%。在0~8k Hz的频带范围内,系统的识别性能更好,Cllr值为0.48,比擦音/s/提升了28%,EER值降低了42%。整体上,元音/i/在高频范围内的识别效果更佳,这一点与擦音/s/一致。这充分说明高频带语音信号内的话者信息更为丰富。然而,司法实践中16k Hz的高采样率录音并不多见,实际案件中语音检材的采样率往往是8k Hz。因此,0~4k Hz频带范围内的性能更能代表案件现实条件。
为进一步探究特征融合对系统识别性能的影响,我们采用逻辑回归模型对/s/和/i/的LPC倒谱特征进行了特征融合。利用融合特征进行说话人识别的结果见表3。图4 0~8k Hz频带范围内利用/i/LPC倒谱特征进行说话人识别的Tippett图
【参考文献】:
期刊论文
[1]法庭语音证据评价的新范式[J]. 张翠玲. 中国人民公安大学学报(自然科学版). 2018(01)
[2]法庭说话人识别语音数据库的构建[J]. 张翠玲,Geoffrey Stewart Morrison. 中国刑警学院学报. 2016(04)
[3]似然比在法庭说话人确认中的应用[J]. 王华朋,杨军,许勇. 证据科学. 2012(01)
本文编号:3142590
【文章来源】:中国刑警学院学报. 2020,(05)
【文章页数】:5 页
【部分图文】:
0~4k Hz频带范围内利用/s/LPC倒谱特征进行说话人识别的Tippett图
图1 0~4k Hz频带范围内利用/s/LPC倒谱特征进行说话人识别的Tippett图表2的结果表明,元音/i/的LPC倒谱特征说话人识别性能明显优于擦音/s/,尤其是在0~4k Hz的信号频带范围内,系统的Cllr值为0.61,相比于擦音/s/识别性能高出29%,提升了近三分之一,EER值降低了38%。在0~8k Hz的频带范围内,系统的识别性能更好,Cllr值为0.48,比擦音/s/提升了28%,EER值降低了42%。整体上,元音/i/在高频范围内的识别效果更佳,这一点与擦音/s/一致。这充分说明高频带语音信号内的话者信息更为丰富。然而,司法实践中16k Hz的高采样率录音并不多见,实际案件中语音检材的采样率往往是8k Hz。因此,0~4k Hz频带范围内的性能更能代表案件现实条件。
为进一步探究特征融合对系统识别性能的影响,我们采用逻辑回归模型对/s/和/i/的LPC倒谱特征进行了特征融合。利用融合特征进行说话人识别的结果见表3。图4 0~8k Hz频带范围内利用/i/LPC倒谱特征进行说话人识别的Tippett图
【参考文献】:
期刊论文
[1]法庭语音证据评价的新范式[J]. 张翠玲. 中国人民公安大学学报(自然科学版). 2018(01)
[2]法庭说话人识别语音数据库的构建[J]. 张翠玲,Geoffrey Stewart Morrison. 中国刑警学院学报. 2016(04)
[3]似然比在法庭说话人确认中的应用[J]. 王华朋,杨军,许勇. 证据科学. 2012(01)
本文编号:3142590
本文链接:https://www.wllwen.com/kejilunwen/wltx/3142590.html