基于压缩感知和音频指纹的固定音频检索方法
发布时间:2022-01-13 20:15
针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题,本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法.在音频检索的训练阶段,首先,对样本音频信号进行稀疏化处理,并通过压缩感知算法对稀疏化后的音频数据进行压缩;其次,提取压缩信号的音频指纹;再次,引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维,最终得到检索特征库.在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论.实验结果表明,所提音频检索方法在确保较好的检索准确率的基础上,大幅度减小了样本音频数据库的存储量,提高了音频的检索速率.
【文章来源】:计算机系统应用. 2020,29(08)
【文章页数】:8 页
【参考文献】:
期刊论文
[1]基于人工智能识别的音乐片段指纹检索技术研究[J]. 王晖楠,魏娇. 自动化与仪器仪表. 2019(05)
[2]基于压缩感知的信号时频表示重构[J]. 李秀梅,吕军. 计算机系统应用. 2016(07)
[3]基于压缩感知的鲁棒性说话人识别参数研究[J]. 于云,周伟栋. 计算机技术与发展. 2016(03)
[4]利用纹理信息的图像分块自适应压缩感知[J]. 王蓉芳,焦李成,刘芳,杨淑媛. 电子学报. 2013(08)
[5]行阶梯观测矩阵、对偶仿射尺度内点重构算法下的语音压缩感知[J]. 叶蕾,杨震,王天荆,孙林慧. 电子学报. 2012(03)
[6]基于K-L距离的两步固定音频检索方法[J]. 齐晓倩,陈鸿昶,黄海. 计算机工程. 2011(19)
[7]一种基于仿生模式识别思想的固定音频检索方法[J]. 张卫强,刘加,陈恩庆. 自然科学进展. 2008(07)
[8]网络音频数据检索技术[J]. 张卫强,刘加. 通信学报. 2007(12)
本文编号:3587077
【文章来源】:计算机系统应用. 2020,29(08)
【文章页数】:8 页
【参考文献】:
期刊论文
[1]基于人工智能识别的音乐片段指纹检索技术研究[J]. 王晖楠,魏娇. 自动化与仪器仪表. 2019(05)
[2]基于压缩感知的信号时频表示重构[J]. 李秀梅,吕军. 计算机系统应用. 2016(07)
[3]基于压缩感知的鲁棒性说话人识别参数研究[J]. 于云,周伟栋. 计算机技术与发展. 2016(03)
[4]利用纹理信息的图像分块自适应压缩感知[J]. 王蓉芳,焦李成,刘芳,杨淑媛. 电子学报. 2013(08)
[5]行阶梯观测矩阵、对偶仿射尺度内点重构算法下的语音压缩感知[J]. 叶蕾,杨震,王天荆,孙林慧. 电子学报. 2012(03)
[6]基于K-L距离的两步固定音频检索方法[J]. 齐晓倩,陈鸿昶,黄海. 计算机工程. 2011(19)
[7]一种基于仿生模式识别思想的固定音频检索方法[J]. 张卫强,刘加,陈恩庆. 自然科学进展. 2008(07)
[8]网络音频数据检索技术[J]. 张卫强,刘加. 通信学报. 2007(12)
本文编号:3587077
本文链接:https://www.wllwen.com/kejilunwen/wltx/3587077.html