当前位置:主页 > 文艺论文 > 广告艺术论文 >

基于机器学习的移动应用推荐系统的研究与实现

发布时间:2017-10-27 22:00

  本文关键词:基于机器学习的移动应用推荐系统的研究与实现


  更多相关文章: 推荐系统 机器学习 概率潜在语义分析 在线学习


【摘要】:随着移动互联网的发展,移动应用(APP)累计数量达到百万级别,其中长尾现象非常严重,大量的冷门APP掩盖在热门APP下,未能被用户注意到。APP关联推荐系统希望在用户浏览当前APP的同时,为其推荐与之相关的其他APP,进而扩大整体的分发数量。 本文所述的移动应用推荐系统基于百度公司的移动应用分发平台,该平台已经完成了初版的APP关联推荐系统。本文的工作正是在原有的APP推荐基础上,提出新的APP推荐模型,具体包括以下几个方面: 在APP推荐系统中引入机器学习技术,将关联APP的每次点击与否作为两类分类问题,借鉴了定向广告系统点击率预估的思路。对比了应用广泛的几种机器学习分类算法在APP推荐问题上的效果,并且通过实验结果来分析说明不同分类效果的差异,从而得出在处理APP推荐问题的一般性结论。为了在语义层面衡量APP之间的相似性,引入主题模型,采用概率潜在语义分析(pLSA)技术来获取APP的文本语义特征。语义特征相比词项特征的泛化能力更强。 本文设计并实现了新模型的离线策略和在线推荐系统。新系统可以完成一整套的数据获取、特征构造、模型训练和线上服务的流程。并引入了在线学习(onlinelearning)方法,实时根据用户行为调整关联结果,以获得更好的推荐效果。 改进后的APP关联推荐系统已经上线,,为百度移动应用分发平台,包括PC端和手机端提供更加准确的APP相关推荐服务。
【关键词】:推荐系统 机器学习 概率潜在语义分析 在线学习
【学位授予单位】:中山大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3;TP18
【目录】:
  • 摘要3-4
  • Abstract4-8
  • 第1章 引言8-11
  • 1.1 背景与现状8-9
  • 1.2 本文的工作9-10
  • 1.3 论文章节安排10-11
  • 第2章 推荐系统相关研究11-16
  • 2.1 推荐系统概述11-12
  • 2.2 基于内容的推荐12
  • 2.3 协同过滤推荐12-15
  • 2.4 本章小结15-16
  • 第3章 推荐问题定义与属性构造16-27
  • 3.1 APP 推荐问题——有监督学习16-17
  • 3.2 文本属性构造17-20
  • 3.3 关键词扩展20
  • 3.4 概率潜在语义分析20-23
  • 3.5 基本特征构造23-24
  • 3.6 组合特征构造24-25
  • 3.7 本章小结25-27
  • 第4章 机器学习模型技术原理27-39
  • 4.1 支持向量机模型27-31
  • 4.2 逻辑斯蒂回归模型31-35
  • 4.3 Online Learning35-38
  • 4.4 本章小结38-39
  • 第5章 实验结果与分析39-45
  • 5.1 离线评价指标39-40
  • 5.2 离线对比实验40-43
  • 5.3 线上效果对比43-44
  • 5.4 本章小结44-45
  • 第6章 系统设计与实现45-55
  • 6.1 系统简介45-48
  • 6.2 数据处理模块48-50
  • 6.3 模型训练与预估模块50-52
  • 6.4 在线处理模块52-53
  • 6.5 本章小结53-55
  • 第7章 总结与展望55-57
  • 7.1 本文工作总结55-56
  • 7.2 不足之处与进一步工作56-57
  • 参考文献57-61
  • 致谢61

【共引文献】

中国期刊全文数据库 前10条

1 钟志农;刘方驰;吴烨;伍江江;;主动学习与自学习的中文命名实体识别[J];国防科技大学学报;2014年04期

2 贾熹滨;张艳华;包锡元;;Kappa加权的子空间融合表情识别方法[J];北京工业大学学报;2014年06期

3 王乐;闭应洲;;基于特征模板提取及SVM的观点句识别[J];广西师范学院学报(自然科学版);2014年03期

4 张吉文;陈笑蓉;;基于谱聚类的词和文档的联合聚类[J];贵州大学学报(自然科学版);2014年05期

5 王秀华;秦振吉;;基于层次K-均值聚类的支持向量机模型[J];计算机应用与软件;2014年05期

6 许强;马登武;;基于傅立叶描述子主要系数的轮廓分类树[J];计算机应用;2014年S1期

7 吴秦;黄彦姣;;基于约束条件随机场的Web对象属性标注[J];计算机科学与探索;2014年09期

8 谢慕哲;罗泽;阎保平;;视频鸟类行为研究中基于尺度不变特征变换的形态分类算法[J];科研信息化技术与应用;2014年03期

9 毕楷明;;碎纸片的拼接复原数学模型的构建[J];价值工程;2014年25期

10 李浩腾;朱信忠;赵建民;曹存根;;基于EKEL的影评挖掘分析方法和系统[J];渤海大学学报(自然科学版);2014年03期

中国硕士学位论文全文数据库 前10条

1 顾奕哲;基于VSM模型的文档表示和贝叶斯网络的软传感器研究[D];华东理工大学;2014年

2 张培倩;基于回归策略的推荐算法研究[D];北京交通大学;2014年

3 徐杰;基于超图融合语义信息的图像场景分类方法[D];北京交通大学;2014年

4 翟强;交通视觉中运动目标的鲁棒性检测[D];北京交通大学;2014年

5 杜胜龙;地下植物根茎探测技术研究[D];南京理工大学;2014年

6 赵峰;基于鉴别投影和回归分类的人脸识别方法研究[D];南京理工大学;2014年

7 彭新茗;基于多层学习的病历实体识别算法设计与实现[D];东北大学;2013年

8 罗凌;面向旅游领域的汉英统计机器翻译关键技术研究[D];厦门大学;2014年

9 张晓雪;基于概率图模型的图像语义分割技术研究[D];厦门大学;2014年

10 胥光华;基于机器学习构建的公司财务预警系统研究[D];厦门大学;2014年



本文编号:1105337

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/1105337.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3f50f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com