基于卷积神经网络的音乐推荐系统
发布时间:2021-06-24 22:33
随着数字多媒体技术的不断发展,音乐库变得越来越大,音乐资源越来越丰富,如何让用户在浩瀚如海的音乐世界里高效地获取自己感兴趣的歌曲便成了一个难题。针对这种现象,个性化音乐推荐系统应运而生。然而,虽然现有的音乐推荐系统种类繁多,但推荐效果良莠不齐,或多或少都存在一些问题。卷积神经网络是近年发展起来,并引起广泛重视的一种高效的深度学习方法,被广泛应用于图像识别、自然语言处理等多个领域,并且取得了比传统机器学习更好的效果。鉴于此,本文提出了基于卷积神经网络的音乐推荐系统。本文提出的音乐推荐系统包括用户建模模块、音频特征提取模块和推荐算法模块等。推荐算法的基本思路是:首先对音乐用户历史行为信息进行采集,利用隐语义模型矩阵分解的方法构建出用户偏好模型;接着对系统中的音频资源进行预处理,并提取出能够代表音乐特征的梅尔频谱图;然后对卷积神经网络进行训练获得音乐潜在特征预测的回归模型,将用户和音乐投影到一个共享的隐空间中;最后通过计算用户偏好特征与音乐潜在特征之间的相似性为目标用户产生TopN推荐。本文对所提出的推荐算法进行了系统性地实验,自行构建了模型训练和测试的用户-音乐数据集,并在典型的卷积神经网...
【文章来源】:南京邮电大学江苏省
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
淘宝、网易云音乐日常推荐效果图
宦畚?第三章 基于卷积神经网络的音乐推荐算法33图 3.4 音频信号的声谱图3.4.2 梅尔频谱与梅尔频率倒谱系数上一节中利用短时傅里叶变换 STFT 得到的声谱图包含了音频信号的全频域信息,通常较为庞大,往往需要对其进行压缩。虽然人耳所能够听到的声音频率在 20-20000Hz 范围内,但是它对不同频率信号响应的灵敏度是不同的,就像一个滤波器组一样,只会有选择地让某些特定的频率信号通过。对于以‘Hz’频率为标度单位而言,人的听觉是一个非线性系统。例如,若将音调频率为 1000Hz 调整到 2000Hz,人耳所能察觉的只是少许变化,而不是提高了一倍。针对这一人类听觉感知特点,在音频信号处理时通常会将‘Hz’频率标度转换为梅尔(Mel)频率标度,二者相互映射关系为:102595log (1 / 700)Mel Hzf f(3.24)1 /2595700(10 1)MelfHz Melf f (3.25)图 3
图 3.4 音频信号的声谱图梅尔频率倒谱系数时傅里叶变换 STFT 得到的声谱图包含了音频信号的对其进行压缩。虽然人耳所能够听到的声音频率在 20号响应的灵敏度是不同的,就像一个滤波器组一样,过。对于以‘Hz’频率为标度单位而言,人的听觉是为 1000Hz 调整到 2000Hz,人耳所能察觉的只是少许类听觉感知特点,在音频信号处理时通常会将‘Hz’二者相互映射关系为:102595log (1 / 700)Mel Hzf f1 /2595700(10 1)MelfHz Melf f
【参考文献】:
期刊论文
[1]音乐推荐系统中的用户冷启动问题[J]. 刘建东,戚利娜. 吉首大学学报(自然科学版). 2017(04)
[2]推荐系统中的隐语义模型研究[J]. 李琳娜,江雪琴. 情报工程. 2016(04)
[3]音乐个性化推荐系统研究综述[J]. 谭学清,何珊. 现代图书情报技术. 2014(09)
[4]音乐推荐技术的现状与发展[J]. 杨倩,潘兴德. 电声技术. 2012(06)
[5]基于卷积神经网络LeNet-5的车牌字符识别研究[J]. 赵志宏,杨绍普,马增强. 系统仿真学报. 2010(03)
[6]互联网推荐系统比较研究[J]. 许海玲,吴潇,李晓东,阎保平. 软件学报. 2009(02)
[7]基于项目评分预测的协同过滤推荐算法[J]. 邓爱林,朱扬勇,施伯乐. 软件学报. 2003(09)
[8]个性化服务技术综述[J]. 曾春,邢春晓,周立柱. 软件学报. 2002(10)
硕士论文
[1]基于用户行为和项目内容的混合推荐算法研究与应用[D]. 艾长青.电子科技大学 2017
本文编号:3247939
【文章来源】:南京邮电大学江苏省
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
淘宝、网易云音乐日常推荐效果图
宦畚?第三章 基于卷积神经网络的音乐推荐算法33图 3.4 音频信号的声谱图3.4.2 梅尔频谱与梅尔频率倒谱系数上一节中利用短时傅里叶变换 STFT 得到的声谱图包含了音频信号的全频域信息,通常较为庞大,往往需要对其进行压缩。虽然人耳所能够听到的声音频率在 20-20000Hz 范围内,但是它对不同频率信号响应的灵敏度是不同的,就像一个滤波器组一样,只会有选择地让某些特定的频率信号通过。对于以‘Hz’频率为标度单位而言,人的听觉是一个非线性系统。例如,若将音调频率为 1000Hz 调整到 2000Hz,人耳所能察觉的只是少许变化,而不是提高了一倍。针对这一人类听觉感知特点,在音频信号处理时通常会将‘Hz’频率标度转换为梅尔(Mel)频率标度,二者相互映射关系为:102595log (1 / 700)Mel Hzf f(3.24)1 /2595700(10 1)MelfHz Melf f (3.25)图 3
图 3.4 音频信号的声谱图梅尔频率倒谱系数时傅里叶变换 STFT 得到的声谱图包含了音频信号的对其进行压缩。虽然人耳所能够听到的声音频率在 20号响应的灵敏度是不同的,就像一个滤波器组一样,过。对于以‘Hz’频率为标度单位而言,人的听觉是为 1000Hz 调整到 2000Hz,人耳所能察觉的只是少许类听觉感知特点,在音频信号处理时通常会将‘Hz’二者相互映射关系为:102595log (1 / 700)Mel Hzf f1 /2595700(10 1)MelfHz Melf f
【参考文献】:
期刊论文
[1]音乐推荐系统中的用户冷启动问题[J]. 刘建东,戚利娜. 吉首大学学报(自然科学版). 2017(04)
[2]推荐系统中的隐语义模型研究[J]. 李琳娜,江雪琴. 情报工程. 2016(04)
[3]音乐个性化推荐系统研究综述[J]. 谭学清,何珊. 现代图书情报技术. 2014(09)
[4]音乐推荐技术的现状与发展[J]. 杨倩,潘兴德. 电声技术. 2012(06)
[5]基于卷积神经网络LeNet-5的车牌字符识别研究[J]. 赵志宏,杨绍普,马增强. 系统仿真学报. 2010(03)
[6]互联网推荐系统比较研究[J]. 许海玲,吴潇,李晓东,阎保平. 软件学报. 2009(02)
[7]基于项目评分预测的协同过滤推荐算法[J]. 邓爱林,朱扬勇,施伯乐. 软件学报. 2003(09)
[8]个性化服务技术综述[J]. 曾春,邢春晓,周立柱. 软件学报. 2002(10)
硕士论文
[1]基于用户行为和项目内容的混合推荐算法研究与应用[D]. 艾长青.电子科技大学 2017
本文编号:3247939
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3247939.html