当前位置:主页 > 科技论文 > 网络通信论文 >

基于LPC倒谱特征融合的法庭说话人识别方法

发布时间:2021-04-17 01:59
  为了探究辅音与元音LPC倒谱特征融合后对法庭说话人识别性能的影响,对汉语普通话中辅音/s/与元音/i/的LPC倒谱特征进行了特征融合,并使用逻辑回归方法对特征融合后的系统输出得分进行校正,同时在似然比框架内基于该融合特征进行了说话人识别的性能测试。结果表明,相对辅音/s/而言,元音/i/的LPC倒谱特征的识别性能更优,特征融合后的系统识别性能比单一使用/s/和/i/的LPC倒谱特征识别时有较大提升。LPC倒谱特征融合在提升说话人识别性能方面具备应用潜力。 

【文章来源】:中国刑警学院学报. 2020,(05)

【文章页数】:5 页

【部分图文】:

基于LPC倒谱特征融合的法庭说话人识别方法


0~4k Hz频带范围内利用/s/LPC倒谱特征进行说话人识别的Tippett图

倒谱,频带,范围,擦音


图1 0~4k Hz频带范围内利用/s/LPC倒谱特征进行说话人识别的Tippett图表2的结果表明,元音/i/的LPC倒谱特征说话人识别性能明显优于擦音/s/,尤其是在0~4k Hz的信号频带范围内,系统的Cllr值为0.61,相比于擦音/s/识别性能高出29%,提升了近三分之一,EER值降低了38%。在0~8k Hz的频带范围内,系统的识别性能更好,Cllr值为0.48,比擦音/s/提升了28%,EER值降低了42%。整体上,元音/i/在高频范围内的识别效果更佳,这一点与擦音/s/一致。这充分说明高频带语音信号内的话者信息更为丰富。然而,司法实践中16k Hz的高采样率录音并不多见,实际案件中语音检材的采样率往往是8k Hz。因此,0~4k Hz频带范围内的性能更能代表案件现实条件。

倒谱,频带,特征融合,范围


为进一步探究特征融合对系统识别性能的影响,我们采用逻辑回归模型对/s/和/i/的LPC倒谱特征进行了特征融合。利用融合特征进行说话人识别的结果见表3。图4 0~8k Hz频带范围内利用/i/LPC倒谱特征进行说话人识别的Tippett图

【参考文献】:
期刊论文
[1]法庭语音证据评价的新范式[J]. 张翠玲.  中国人民公安大学学报(自然科学版). 2018(01)
[2]法庭说话人识别语音数据库的构建[J]. 张翠玲,Geoffrey Stewart Morrison.  中国刑警学院学报. 2016(04)
[3]似然比在法庭说话人确认中的应用[J]. 王华朋,杨军,许勇.  证据科学. 2012(01)



本文编号:3142590

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3142590.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5f9db***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com