当前位置:主页 > 科技论文 > 搜索引擎论文 >

个性化音乐推荐系统的研究与实现

发布时间:2017-08-24 02:21

  本文关键词:个性化音乐推荐系统的研究与实现


  更多相关文章: 推荐系统 音乐推荐 歌词语义 协同过滤 Hadoop


【摘要】:在互联网时代,各类音乐网站极大的方便了人们对于音乐的需求。然而,大型的音乐门户网站能够保存上千万首歌曲,在面对如此海量的音乐信息时,人们往往难以从中找到符合自己“口味”的歌曲。传统的搜索引擎只适合应用在用户有明确的目标并且能够用关键词准确的表达出来的信息检索问题。同时,音乐是一个典型的具有“LongTail”(长尾)现象的物品——只有极少部分的歌曲会被用户下载,绝大部分音乐往往无人问津。因此,个性化音乐推荐系统正是为了在没有明确需求的情况下,挖掘处于长尾部分音乐,帮助人们找到其喜爱的歌曲。 推荐系统是信息过滤(information filtering)系统的一种,它的主要功能是预测用户对某个物品的喜爱程度。在个性化音乐推荐领域,主流的推荐方法有两类,一是基于内容的推荐,二是基于协同的推荐。其中,正确的计算音乐之间的相似度是这两类推荐方法的关键所在。然而,这两种方法都存在某些不足之处,如基于内容的推荐存在推荐准确率不高的问题,基于协同的推荐倾向于为用户推荐热门的歌曲。 本文通过对这两类推荐算法较为全面和深入的分析,发现这两类算法之间的存在一定的互补关系。因此,本文提出了一种将基于内容和基于协同过滤相混合的推荐算法——语义增强型的协同过滤算法。本算法首先分析了歌词中隐含的语义信息,并计算歌曲歌词之间的语义相似度,然后基于用户的音乐下载历史计算歌曲的共现相似度。因为歌词代表着一首歌曲想要传达给听众的思想感情,所以通过结合这两种不同的相似度信息,本推荐算法可以改善基于协同过滤算法的不足之处。本文研究对象是带有歌词的歌曲,在后文中,音乐、歌曲都指代含有歌词的一类歌曲。 本文开发的个性化音乐推荐系统的核心算法就是语义增强型的协同过滤算法。经试验证明,在推荐冷门音乐时,本文提出的混合推荐算法比纯粹的基于内容和基于协同的推荐方法都更加有效。为满足当前为庞大用户群推荐海量音乐的需求,本系统在开发时使用了目前主流的大数据分布式计算平台Hadoop。借助Hadoop优异的扩展性经实验证明本推荐系统能够有效的完成几十万用户的计算工作 本文主要的研究工作如下: 首先,研究用户的歌曲下载数据,根据歌曲下载次数的分布,将歌曲分为热门音乐和冷门音乐两类,更加细致、有针对性的分析推荐算法的推荐性能。然后,较为深入和全面的研究个性化推荐领域的主流算法基本原理,在分析算法的优点和不足基础上,本文提出了语义增强型的协同过滤算法。本算法在传统的协同过滤算法中引入了歌曲歌词的语义信息,以此缓解协同过滤算法的不足。经试验证明取得了较好的成果。其次,使用Hadoop相关技术实现语义增强型的协同过滤算法,使推荐算法能够完成大规模的用户推荐计算。
【关键词】:推荐系统 音乐推荐 歌词语义 协同过滤 Hadoop
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
  • 摘要4-6
  • ABSTRACT6-8
  • 目录8-10
  • 第一章 绪论10-14
  • 1.1 推荐系统的研究背景10
  • 1.2 个性化音乐推荐系统的研究意义10-11
  • 1.3 推荐系统的研究现状11-12
  • 1.4 本文主要研究工作12
  • 1.5 论文组织结构12-14
  • 第二章 推荐系统方法及原理综述14-27
  • 2.1 推荐系统简介14-16
  • 2.2 基于内容的推荐系统16-20
  • 2.2.1 向量空间模型与余弦相似度17-18
  • 2.2.2 朴素贝叶斯分类器18-20
  • 2.3 基于协同过滤的推荐系统20-26
  • 2.3.1 基于邻域的协同过滤算法22-23
  • 2.3.2 基于邻域的协同过滤算法三个关键点23-25
  • 2.3.3 基于模型的协同过滤算法25-26
  • 2.4 本章小结26-27
  • 第三章 语义增强型协同过滤算法的研究27-46
  • 3.1 用户音乐下载数据分析27-28
  • 3.2 语义增强型的协同过滤算法基本原理28-31
  • 3.2.1 当前主流音乐推荐算法的不足28-30
  • 3.2.2 语义增强型协同过滤算法的基本原理和流程30-31
  • 3.3 歌曲歌词的隐语义分析31-38
  • 3.3.1 歌曲歌词在推荐系统中的研究意义31-32
  • 3.3.2 歌词语料库的建立32-33
  • 3.3.3 歌曲歌词的预处理33-35
  • 3.3.4 歌曲歌词的隐语义分析原理35-38
  • 3.4 歌曲的协同信息分析38-40
  • 3.4.1 歌曲的协同信息定义38-39
  • 3.4.2 歌曲协同信息分析原理39-40
  • 3.5 用户歌曲推荐列表计算40-41
  • 3.6 语义增强型的协同过滤算法对比实验及结果分析41-44
  • 3.6.1 实验原理及方法41-42
  • 3.6.2 实验结果分析42-44
  • 3.7 语义增强型的协同过滤算法总结44-45
  • 3.8 本章小结45-46
  • 第四章 个性化音乐推荐系统的设计与实现46-61
  • 4.1 个性化音乐推荐系统需求分析46
  • 4.2 个性化音乐推荐系统的设计46-51
  • 4.2.1 个性化音乐推荐系统流程46-47
  • 4.2.2 个性化音乐推荐系统的功能架构47-49
  • 4.2.3 个性化音乐推荐系统架构49-50
  • 4.2.4 个性化音乐推荐系统的数据库设计50-51
  • 4.3 个性化音乐推荐系统的实现51-59
  • 4.3.1 Hadoop集群搭建51-52
  • 4.3.2 歌词爬虫的实现和歌词语料库的建立52-54
  • 4.3.3 语义增强型的协同过滤算法的实现54-57
  • 4.3.4 WebService数据接口的实现57-59
  • 4.4 系统测试59-60
  • 4.5 本章小结60-61
  • 第五章 总结与展望61-64
  • 5.1 论文工作总结61-62
  • 5.2 未来展望62-64
  • 参考文献64-67
  • 致谢67-68
  • 攻读学位期间发表的学术论文68

【共引文献】

中国期刊全文数据库 前10条

1 马建威;徐浩;陈洪辉;;信息推荐系统中的朋友关系预测算法设计[J];国防科技大学学报;2013年01期

2 李玲;任青;付园;陈鹤;梅圣民;;基于Hadoop的社交网络服务推荐算法[J];吉林大学学报(信息科学版);2013年04期

3 黄震华;;云环境下top-n推荐算法[J];电子学报;2015年01期

4 方潇;李萌;包們;林宏波;;基于眼动实验的个性化地图推荐模型探讨[J];地理空间信息;2015年01期

5 汪秉宏;周涛;周昌松;;人类行为、复杂网络及信息挖掘的统计物理研究[J];上海理工大学学报;2012年02期

6 王国霞;刘贺平;;个性化推荐系统综述[J];计算机工程与应用;2012年07期

7 李磊;王丁丁;朱顺痣;李涛;;Personalized News Recommendation:A Review and an Experimental Investigation[J];Journal of Computer Science & Technology;2011年05期

8 吴逸明;;融合的协同过滤推荐算法[J];计算机与现代化;2011年06期

9 王宗武;;基于信任用户联合聚类的协同过滤算法[J];计算机与现代化;2013年09期

10 莫同;褚伟杰;李伟平;吴中海;;一种基于扩展FP-TREE的服务推荐方法[J];华中科技大学学报(自然科学版);2013年S2期

中国博士学位论文全文数据库 前10条

1 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年

2 蒲海涛;物联网环境下基于上下文感知的智能交互关键技术研究[D];山东科技大学;2011年

3 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年

4 李晓;自适应人机交互界面研究[D];西南师范大学;2004年

5 张程;面向服务环境中服务的个性化推荐[D];中国科学院研究生院(计算技术研究所);2006年

6 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年

7 张磊;基于本体的主动式知识系统及其若干关键技术研究[D];南京航空航天大学;2006年

8 李涛;推荐系统中若干关键问题研究[D];南京航空航天大学;2009年

9 镇璐;基于知识网格的知识供应理论与技术[D];上海交通大学;2008年

10 张磊;个性化推荐和搜索中若干关键问题的研究[D];北京邮电大学;2009年

中国硕士学位论文全文数据库 前10条

1 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年

2 韩璐;针对推荐系统中信息共享需求下隐私保护机制的研究与实现[D];华东师范大学;2011年

3 鲍光余;基于潜在语义分析的农户个性化推荐系统[D];海南大学;2011年

4 路华;小众推荐技术研究与应用[D];电子科技大学;2011年

5 韩增义;科技论文推荐系统研究与实现[D];电子科技大学;2011年

6 焦晨斌;协同过滤算法在电子商务推荐系统的研究[D];郑州大学;2011年

7 寇艳艳;电子商务推荐系统中用户聚类问题与用户兴趣变化问题研究[D];中国科学技术大学;2011年

8 王金辉;基于标签的协同过滤稀疏性问题研究[D];中国科学技术大学;2011年

9 杜定宇;基于特征向量的个性化推荐算法研究[D];重庆大学;2011年

10 唐小宇;基于论文关键词聚类的用户兴趣模型细化方法研究[D];山东科技大学;2011年



本文编号:728664

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/728664.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5d74d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com