基于机器学习的移动应用推荐系统的研究与实现
本文关键词:基于机器学习的移动应用推荐系统的研究与实现
更多相关文章: 推荐系统 机器学习 概率潜在语义分析 在线学习
【摘要】:随着移动互联网的发展,移动应用(APP)累计数量达到百万级别,其中长尾现象非常严重,大量的冷门APP掩盖在热门APP下,未能被用户注意到。APP关联推荐系统希望在用户浏览当前APP的同时,为其推荐与之相关的其他APP,进而扩大整体的分发数量。 本文所述的移动应用推荐系统基于百度公司的移动应用分发平台,该平台已经完成了初版的APP关联推荐系统。本文的工作正是在原有的APP推荐基础上,提出新的APP推荐模型,具体包括以下几个方面: 在APP推荐系统中引入机器学习技术,将关联APP的每次点击与否作为两类分类问题,借鉴了定向广告系统点击率预估的思路。对比了应用广泛的几种机器学习分类算法在APP推荐问题上的效果,并且通过实验结果来分析说明不同分类效果的差异,从而得出在处理APP推荐问题的一般性结论。为了在语义层面衡量APP之间的相似性,引入主题模型,采用概率潜在语义分析(pLSA)技术来获取APP的文本语义特征。语义特征相比词项特征的泛化能力更强。 本文设计并实现了新模型的离线策略和在线推荐系统。新系统可以完成一整套的数据获取、特征构造、模型训练和线上服务的流程。并引入了在线学习(onlinelearning)方法,实时根据用户行为调整关联结果,以获得更好的推荐效果。 改进后的APP关联推荐系统已经上线,,为百度移动应用分发平台,包括PC端和手机端提供更加准确的APP相关推荐服务。
【关键词】:推荐系统 机器学习 概率潜在语义分析 在线学习
【学位授予单位】:中山大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3;TP18
【目录】:
- 摘要3-4
- Abstract4-8
- 第1章 引言8-11
- 1.1 背景与现状8-9
- 1.2 本文的工作9-10
- 1.3 论文章节安排10-11
- 第2章 推荐系统相关研究11-16
- 2.1 推荐系统概述11-12
- 2.2 基于内容的推荐12
- 2.3 协同过滤推荐12-15
- 2.4 本章小结15-16
- 第3章 推荐问题定义与属性构造16-27
- 3.1 APP 推荐问题——有监督学习16-17
- 3.2 文本属性构造17-20
- 3.3 关键词扩展20
- 3.4 概率潜在语义分析20-23
- 3.5 基本特征构造23-24
- 3.6 组合特征构造24-25
- 3.7 本章小结25-27
- 第4章 机器学习模型技术原理27-39
- 4.1 支持向量机模型27-31
- 4.2 逻辑斯蒂回归模型31-35
- 4.3 Online Learning35-38
- 4.4 本章小结38-39
- 第5章 实验结果与分析39-45
- 5.1 离线评价指标39-40
- 5.2 离线对比实验40-43
- 5.3 线上效果对比43-44
- 5.4 本章小结44-45
- 第6章 系统设计与实现45-55
- 6.1 系统简介45-48
- 6.2 数据处理模块48-50
- 6.3 模型训练与预估模块50-52
- 6.4 在线处理模块52-53
- 6.5 本章小结53-55
- 第7章 总结与展望55-57
- 7.1 本文工作总结55-56
- 7.2 不足之处与进一步工作56-57
- 参考文献57-61
- 致谢61
【共引文献】
中国期刊全文数据库 前10条
1 钟志农;刘方驰;吴烨;伍江江;;主动学习与自学习的中文命名实体识别[J];国防科技大学学报;2014年04期
2 贾熹滨;张艳华;包锡元;;Kappa加权的子空间融合表情识别方法[J];北京工业大学学报;2014年06期
3 王乐;闭应洲;;基于特征模板提取及SVM的观点句识别[J];广西师范学院学报(自然科学版);2014年03期
4 张吉文;陈笑蓉;;基于谱聚类的词和文档的联合聚类[J];贵州大学学报(自然科学版);2014年05期
5 王秀华;秦振吉;;基于层次K-均值聚类的支持向量机模型[J];计算机应用与软件;2014年05期
6 许强;马登武;;基于傅立叶描述子主要系数的轮廓分类树[J];计算机应用;2014年S1期
7 吴秦;黄彦姣;;基于约束条件随机场的Web对象属性标注[J];计算机科学与探索;2014年09期
8 谢慕哲;罗泽;阎保平;;视频鸟类行为研究中基于尺度不变特征变换的形态分类算法[J];科研信息化技术与应用;2014年03期
9 毕楷明;;碎纸片的拼接复原数学模型的构建[J];价值工程;2014年25期
10 李浩腾;朱信忠;赵建民;曹存根;;基于EKEL的影评挖掘分析方法和系统[J];渤海大学学报(自然科学版);2014年03期
中国硕士学位论文全文数据库 前10条
1 顾奕哲;基于VSM模型的文档表示和贝叶斯网络的软传感器研究[D];华东理工大学;2014年
2 张培倩;基于回归策略的推荐算法研究[D];北京交通大学;2014年
3 徐杰;基于超图融合语义信息的图像场景分类方法[D];北京交通大学;2014年
4 翟强;交通视觉中运动目标的鲁棒性检测[D];北京交通大学;2014年
5 杜胜龙;地下植物根茎探测技术研究[D];南京理工大学;2014年
6 赵峰;基于鉴别投影和回归分类的人脸识别方法研究[D];南京理工大学;2014年
7 彭新茗;基于多层学习的病历实体识别算法设计与实现[D];东北大学;2013年
8 罗凌;面向旅游领域的汉英统计机器翻译关键技术研究[D];厦门大学;2014年
9 张晓雪;基于概率图模型的图像语义分割技术研究[D];厦门大学;2014年
10 胥光华;基于机器学习构建的公司财务预警系统研究[D];厦门大学;2014年
本文编号:1105337
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/1105337.html