当前位置:主页 > 科技论文 > 网络通信论文 >

基于听觉特性卷积神经网络的音乐分类方法研究

发布时间:2021-11-26 12:40
  从卡带时代、CD时代、再到数字音乐时代,音乐数量呈现爆发式增长。唯有对海量音乐资源进行分类,建立高效音乐检索系统,才能帮助人们快速地搜索到期望的音乐。传统音乐分类方法比较依赖于人工标注。在大数据时代,通过人工标注来完成音乐分类任务是低效率且不现实的。因此音乐自动分类逐渐成为研究热点,并被广泛使用。音乐自动分类是实现音乐资源快速、有效检索的基础,其拥有巨大潜在应用需求,因此音乐自动分类方法具有重要的研究意义。音乐自动分类方法有两个关键步骤:特征提取和分类方法。本文基于听觉特性对特征提取和分类方法两个关键步骤进行改进,针对音乐分类任务提出基于听觉特性卷积神经网络的音乐分类方法。本文的主要工作和创新点如下:(1)在特征提取中,本文借鉴语音信号处理常用的耳蜗滤波器倒谱系数,将其应用于音乐特征提取中。耳蜗滤波器倒谱系数提取流程模拟了人耳听觉系统感知声音的过程,使提取到的特征更符合人耳听觉特性。由于音乐信号频域跨度相比于语音信号更宽,因此本文在耳蜗滤波器倒谱系数的提取步骤中增加了低频和高频的滤波器,使提取到的音乐特征更全、更详细,直接提高特征提取的质量。(2)在分类方法中,本文借鉴了Lecun等人... 

【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:78 页

【学位级别】:硕士

【部分图文】:

基于听觉特性卷积神经网络的音乐分类方法研究


人耳结构

伸缩因子,母小波,因子


第三章 时频倒谱系数从公式(3-13)可以看出,不同于傅里叶变换只有频率 这一个变量的性质,小变换有两个变量:伸缩因子 a 和平移因子 b。伸缩因子 a 控制母小波 t 的伸缩,把小波由 t 变换成 t a ,假设 a>1,那么当 a 越大使,则 的时域宽度比 t宽;反过来,a 越小,则的 时域宽度也越窄。而平移因子 b 控制着母小波 时间平移,确定了对输入信号 x(t)的分析时间点。因此,伸缩因子 a 和平移因子 b 联起来控制了对输入信号 x(t)进行分析的时间点和分析的时间宽度,伸缩因子 a 和平移子 b 对母小波的影响如图 3-7 所示:

【参考文献】:
期刊论文
[1]融合Mel系数和kNN的语音端点检测[J]. 韩云飞,张太红,白涛.  信息技术. 2017(03)
[2]基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J]. 胡峰松,张璇.  计算机应用. 2012(09)
[3]音乐作品风格流派的神经网络识别方法研究[J]. 喻晓雯,张楠,张勇.  计算机工程与应用. 2011(27)
[4]音乐医学及其临床应用[J]. 敖欣,黄湘,刘丹.  实用中西医结合临床. 2004(03)
[5]语音/音乐自动分类中的特征分析[J]. 卢坚,陈毅松,孙正兴,张福炎.  计算机辅助设计与图形学学报. 2002(03)
[6]从傅立叶变化到小波变化[J]. 刘鲁源,李宗勃.  自动化与仪表. 2000(06)

硕士论文
[1]基于声学特征的乐器识别研究[D]. 林玉志.华南理工大学 2012



本文编号:3520164

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3520164.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户16aa2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com