手机应用商城智能推荐平台的研究与应用
本文关键词:手机应用商城智能推荐平台的研究与应用,由笔耕文化传播整理发布。
【摘要】:手机应用商城是手机用户下载app、电子书籍、动漫等的主要客户端。随着app等数量激增,如何帮助用户更好找到其感兴趣的商品是应用商城的核心需求之一。当用户有明确需求时,搜索就能够满足其需求;当用户的需求不太明确或需求较难用关键词来描述时,推荐能够在一定程度上帮助用户找到其感兴趣的商品。本文主要的研究与工作是为某通信运营商的手机应用商城提供相关推荐系统的实现,包括app、电子书籍、动漫的相关推荐。当用户浏览某个商品的详情页时,相应页面的猜你喜欢功能会为用户推荐4个跟正在浏览商品相关的商品。根据应用商城已有的用户行为数据以及相应的商品的元数据的情况,对于不同的类别的商品采用不同的推荐模型。对于app,为了综合利用协同过滤与基于内容推荐各自的优点,系统采用二项逻辑回归对基于物品的协同过滤和基于内容的推荐进行线性结合,逻辑回归训练数据来源于线上用户真实数据。在进行两个推荐算法线性结合前会利用用户正在浏览app类别去过滤推荐结果中不属于该类别的商品以提高推荐商品与用户正在浏览商品的相似度。对于功能比较相似的几个类别的商品,系统还采用app的价值模型[1]对结果进行重排序以确保推荐商品都是有一定的价值。app价值模型的前提是推荐商品与用户正在浏览商品功能相似,模型参数可从用户的行为中学习。系统现在的app推荐模型比刚上线时所采用仅基于物品的协同过滤模型的点击率和转化率分别提高了30%和20%。而应用商城上的动漫和书籍现阶段只有少量的用户行为,系统则采用基于内容的相关推荐算法。app、动漫以及电子书籍在内容相似度计算上所采用的特征都是TF-IDF。由于应用商城的用户行为数据和商品数据量大,本文采用开源的分布式大数据处理框架Hadoop去构建推荐系统。有些推荐算法在Hadoop上面实现必须做一定优化使其高效运行。本人在基于内容的相关推荐算法在Hadoop上面实现时做了对热点数据切分和组合以及减少数据冗余的优化。对热点数据的切分和组合使得数据能真正均匀分布在集群上运行,减少数据冗余在Hadoop上面即减少了磁盘IO和网络IO。在实现优化后,电子书籍的内容相似度计算时间由15个小时下降到6个小时。推荐系统的结果存储在HBase,本人也实现相应web服务响应客户端的推荐请求。该应用商城的推荐服务已于2014年11月底上线服务,每天的PV访问量超过100万。截止到目前已稳定服务了几个月,推荐的点击率与转化率达到了通信运营商之前所设定的目标。
【关键词】:手机商城推荐 协同过滤 基于内容推荐 混合推荐 Hadoop
【学位授予单位】:中山大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
- 摘要3-5
- Abstract5-10
- 第一章 概述10-18
- 1.1 项目背景与意义10-11
- 1.2 国内外研究与开发现状分析11-15
- 1.2.1 推荐系统11-12
- 1.2.2 手机应用商城推荐12-14
- 1.2.3 大数据14-15
- 1.3 项目的主要工作15-17
- 1.4 论文的结构17-18
- 第二章 相关原理与技术18-29
- 2.1 推荐算法18-23
- 2.1.1 协同过滤18-19
- 2.1.2 基于内容的推荐算法19-21
- 2.1.3 混合推荐21-22
- 2.1.4 app价值模型22-23
- 2.1.5 推荐效果衡量方法23
- 2.2 Hadoop23-29
- 2.2.1 HDFS24-25
- 2.2.2 MapReduce25-27
- 2.2.3 Hbase27-29
- 第三章 iMarket推荐系统需求分析29-33
- 3.1 iMarket推荐系统需求概述29
- 3.2 iMarket推荐系统用例分析29-31
- 3.3 iMarket推荐系统领域分析与建模31
- 3.4 iMarket推荐系统非功能性需求31-33
- 第四章 iMarket推荐系统的算法与实现33-49
- 4.1 电子书籍与动漫推荐算法33-40
- 4.1.1 电子书籍与动漫推荐算法概述33-34
- 4.1.2 电子书籍与动漫基于内容推荐算法实现34-37
- 4.1.3 基于内容推荐算法在Hadoop实现的优化37-39
- 4.1.4 基于内容推荐算法复杂度39-40
- 4.2 app推荐算法40-48
- 4.2.1 app推荐算法概述40
- 4.2.2 app基于物品协同过滤实现40-43
- 4.2.3 app协同过滤与基于内容推荐线性结合43-45
- 4.2.4 app价值模型对部分推荐结果进行调整45-47
- 4.2.5 app推荐算法复杂度47-48
- 4.3 推荐结果的过滤规则48-49
- 第五章 iMarket推荐系统设计49-57
- 5.1 iMarket推荐系统架构49-51
- 5.2 iMarket推荐系统数据流程51-54
- 5.3 iMarket推荐系统代码模块设计54-57
- 5.3.1 主要代码模块54-56
- 5.3.2 代码的详细设计56-57
- 第六章 iMarket推荐系统部署与应用57-63
- 6.1 iMarket推荐系统线上运行坏境57-59
- 6.2 iMarket线上推荐服务稳定性的保障59-60
- 6.3 iMarket推荐结果展示60-63
- 第七章 总结与展望63-65
- 7.1 总结63
- 7.2 展望63-65
- 参考文献65-68
- 致谢68
【相似文献】
中国期刊全文数据库 前10条
1 张海玉;刘志都;杨彩;贾松浩;;基于页面聚类的推荐算法的改进[J];计算机应用与软件;2008年09期
2 王文;;个性化推荐算法研究[J];电脑知识与技术;2010年16期
3 张恺;秦亮曦;宁朝波;李文阁;;改进评价估计的混合推荐算法研究[J];微计算机信息;2010年36期
4 杨博;赵鹏飞;;推荐算法综述[J];山西大学学报(自然科学版);2011年03期
5 吴泓辰;王新军;成勇;彭朝晖;;基于协同过滤与划分聚类的改进推荐算法[J];计算机研究与发展;2011年S3期
6 赵玉艳;谷胜伟;;一种面向云计算环境的服务推荐算法[J];巢湖学院学报;2012年03期
7 李克潮;梁正友;;基于多特征的个性化图书推荐算法[J];计算机工程;2012年11期
8 吕善国;吴效葵;曹义亲;;基于网络结构的推荐算法[J];实验室研究与探索;2012年07期
9 苏莹;刘建国;郭强;田大钢;;考虑负面评价的个性化推荐算法研究[J];运筹与管理;2012年06期
10 郑志娴;;微博个性化内容推荐算法研究[J];电脑开发与应用;2012年12期
中国重要会议论文全文数据库 前10条
1 王韬丞;罗喜军;杜小勇;;基于层次的推荐:一种新的个性化推荐算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 唐灿;;基于模糊用户心理模式的个性化推荐算法[A];2008年计算机应用技术交流会论文集[C];2008年
3 秦国;杜小勇;;基于用户层次信息的协同推荐算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 周玉妮;郑会颂;;基于浏览路径选择的蚁群推荐算法:用于移动商务个性化推荐系统[A];社会经济发展转型与系统工程——中国系统工程学会第17届学术年会论文集[C];2012年
5 苏日启;胡皓;汪秉宏;;基于网络的含时推荐算法[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
6 梁莘q,
本文编号:276140
本文链接:https://www.wllwen.com/wenyilunwen/dongmansheji/276140.html