视唱自动评价系统的研究与实现
发布时间:2022-01-03 03:39
视唱是指视唱者看到乐谱时,将乐谱中的音符转化为相应音调并演唱,对于初学者通常要求其视唱音符完整、音高准确。但传统的视唱教学评价方法严重依赖人工,无法实现批量化、自动化评判,而现有的自动评价系统大多对乐曲输出整体的主观性评价,而缺乏音符级正误的客观反馈。因此,研究客观的、音符级的视唱自动评价系统具有重要意义。现有的视唱自动评价系统通常输入一段视唱音频,系统对视唱音频进行音高、音量、旋律等音频特征的提取,并与标准音频进行特征比对,最终输出视唱评价。本文设计并实现的视唱自动评价系统,输入为视唱音频与标准乐谱音符序列,系统将视唱音频按照音符进行切分获取视唱音符序列,并将视唱音符序列与标准乐谱的音符序列对齐,并进行音高的逐一比对,最终输出音符级的正误评价。本文所提出的系统涉及音符起始点检测、音高提取及音符序列对齐三个技术点,论文重点研究了人声的起始点检测问题和音符序列的对齐问题,并结合样本分析设计实现了相应算法。本文的创新内容主要有以下几方面:(1)针对基于传统声学模型的人声演唱音符起始点检测方法准确率低的问题,设计了基于CNN的人声音符起始点检测模型。该模型在本文自建并公开数据集HUST-So...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
人声的频谱图
图 2-2 CQT 中带宽与中心频率的的关系若 ( )为离散时域信号,则其 CQT 变换为 ( ) ∑ ( ) ( ) ( k(¢) ¤( )(, 是第 个点的中心频率, 是每个八度的频率点数, 是第 个点的窗 成反比,其比值为Q, 是采样频率, ( )是长度为 为窗函数。公式中的 (¢)的复共轭, ( )也被称为时频原子。中心频率 可以被定义为: (, 是最低频率点的中心频率。在实际应用中, 是非常重要的参数,它通了时频分辨率。对应的窗长由如下公式给出:
28图 4-4 一帧音频的频谱 4-3 视唱音频片段频谱图所示,图中黄色代表能量值,颜色越深头指向基频及其谐波,可以看到黑框部分的基频的能量要弱于三的频谱如图 4-4 一帧音频的频谱所示,其中三次谐波在频谱中的此使用式中的压缩因子 h 可以降低高次谐波在置信度计算中的权以有效抑制倍频现象,同时消除半频的影响。本步骤设置压缩因 使得谐波次数与权重成反比。出置信度后,将所有候选基频的置信度比较,选取置信度最高的频
【参考文献】:
期刊论文
[1]基于权值分配的音符识别研究[J]. 卞毓伟,郭玲. 计算机与现代化. 2017(03)
[2]基于语句特征的音乐哼唱快速检索技术[J]. 王培培,杨晓春,王斌,王晓晔. 东北大学学报(自然科学版). 2017(03)
[3]基于高频加权CQT谱的音符起始点检测[J]. 林静,贺前华,李新超,杨继臣. 计算机工程与设计. 2015(09)
[4]一种结合端点检测可检错的DTW乐谱跟随算法[J]. 吴康妍,李锵,关欣. 计算机应用与软件. 2015(03)
[5]基于特征比对的音乐学唱系统设计与实现[J]. 刘清堂,敖欢欢,李浩. 计算机工程与设计. 2014(07)
[6]基于音乐内容分析的音频认证算法[J]. 汪竹蓉,李伟,朱碧磊,李晓强. 计算机研究与发展. 2012(01)
[7]几种音乐识别算法比较[J]. 顾亦然,秦军,王锁萍,杨灵. 南京邮电学院学报. 1998(02)
本文编号:3565490
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
人声的频谱图
图 2-2 CQT 中带宽与中心频率的的关系若 ( )为离散时域信号,则其 CQT 变换为 ( ) ∑ ( ) ( ) ( k(¢) ¤( )(, 是第 个点的中心频率, 是每个八度的频率点数, 是第 个点的窗 成反比,其比值为Q, 是采样频率, ( )是长度为 为窗函数。公式中的 (¢)的复共轭, ( )也被称为时频原子。中心频率 可以被定义为: (, 是最低频率点的中心频率。在实际应用中, 是非常重要的参数,它通了时频分辨率。对应的窗长由如下公式给出:
28图 4-4 一帧音频的频谱 4-3 视唱音频片段频谱图所示,图中黄色代表能量值,颜色越深头指向基频及其谐波,可以看到黑框部分的基频的能量要弱于三的频谱如图 4-4 一帧音频的频谱所示,其中三次谐波在频谱中的此使用式中的压缩因子 h 可以降低高次谐波在置信度计算中的权以有效抑制倍频现象,同时消除半频的影响。本步骤设置压缩因 使得谐波次数与权重成反比。出置信度后,将所有候选基频的置信度比较,选取置信度最高的频
【参考文献】:
期刊论文
[1]基于权值分配的音符识别研究[J]. 卞毓伟,郭玲. 计算机与现代化. 2017(03)
[2]基于语句特征的音乐哼唱快速检索技术[J]. 王培培,杨晓春,王斌,王晓晔. 东北大学学报(自然科学版). 2017(03)
[3]基于高频加权CQT谱的音符起始点检测[J]. 林静,贺前华,李新超,杨继臣. 计算机工程与设计. 2015(09)
[4]一种结合端点检测可检错的DTW乐谱跟随算法[J]. 吴康妍,李锵,关欣. 计算机应用与软件. 2015(03)
[5]基于特征比对的音乐学唱系统设计与实现[J]. 刘清堂,敖欢欢,李浩. 计算机工程与设计. 2014(07)
[6]基于音乐内容分析的音频认证算法[J]. 汪竹蓉,李伟,朱碧磊,李晓强. 计算机研究与发展. 2012(01)
[7]几种音乐识别算法比较[J]. 顾亦然,秦军,王锁萍,杨灵. 南京邮电学院学报. 1998(02)
本文编号:3565490
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3565490.html