基于在线快速学习隐语义模型的个性化新闻推荐
本文关键词:基于在线快速学习隐语义模型的个性化新闻推荐,,由笔耕文化传播整理发布。
【摘要】:互联网中的个性化新闻,个性化在线广告、网络搜索等应用拥有庞大、动态项目池,由此产生的推荐问题在Web应用程序中无处不在,特别是在个性化新闻推荐领域,由于新闻独有的实时动态特性,需要研究针对动态新闻的推荐系统。现有的推荐尽管能获得丰富的项目元数据,包括项目主体内容,分类目录,摘要等内容,但项目粒度过于不均匀,通常需要在模型中确定项目具体的因子(权重)。由于估计项目因子属于密集型计算,所以实时推荐面临的重要挑战是如何快速在线为新项目(例如新闻、事件更新、推特)学习因子。我们提出了一个快速学习隐语义模型,通过在线回归方法快速学习项目的具体因子。可以独立运行针对每个项目的在线回归,处理过程快速,可扩展且容易并行开展。但这些独立回归的收敛会由于维度高而进展缓慢。因此,我们使用大量的历史数据提取用户项目特征进行线下学习并作为模型的初始化过程以及学习用户与项目的基础因子模型,然后降维并存档。在线时段,提取高峰时段行为数据最优化低维修正向量。借助基于优化预测可能性的在线模型,估算线性预测目标的评分。这样既降低了模型学习的维度,又保证了隐含因子学习的准确性,取得实时良好的推荐效果。并基于此方法给出了个性化新闻推荐的系统实现过程。大量的实验表明我们的方法显著、一致优于其它竞争方法(基于特征、离线、在线协同过滤,概率潜语义索引等)并且获得了相对提升:在预测的对数似然性方面有10%~15%的提升;度量专有My Yahoo!数据集上相关性评分有200%~300%的提升;对比Movie Lens数据集上使用基于时间的训练数据划分方法有了9%的均方根误差的降低。本文主要工作包括:1、构建线下模型:对海量新闻和用户实现快速准确的关键特征提取,满足基于特征初始化的推荐要求,为实时推荐作准备。2、构建线上模型:基于用户即时行为记录,快速学习线上修正参数使线上模型快速收敛,为每个用户构建完整的个性化的偏好模型。3、设计并实现推荐系统并确保性能满足要求,实现实时为不同的用户推荐个性化新闻推荐的方案,使每个用户便捷获得自己感兴趣的新闻资讯,方便快捷地发现高质量且感兴趣的新新闻。
【关键词】:降秩回归 推荐系统 隐含因子 矩阵分解 二元数据
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
- 摘要4-5
- Abstract5-9
- 第一章 绪论9-12
- 1.1 研究背景及意义9-10
- 1.2 相关工作10-11
- 1.3 论文组织结构11-12
- 第二章 个性化推荐技术相关工作12-20
- 2.1 个性化推荐系统概述12-13
- 2.2 个性化推荐方法13-16
- 2.2.1 协同过滤推荐13-15
- 2.2.2 基于内容的推荐15
- 2.2.3 混合推荐系统15-16
- 2.3 个性化推荐在新闻领域的应用16-18
- 2.3.1 面向新闻的个性化推荐16-17
- 2.3.2 个性化新闻推荐现状17-18
- 2.3.3 个性化新闻推荐面临的挑战18
- 2.4 本章小结18-20
- 第三章 基于隐语义模型的个性化新闻推荐技术研究20-34
- 3.1 隐语义模型20-25
- 3.1.1 概述20-22
- 3.1.2 基本算法与弊端22-25
- 3.2 基于在线快速学习的隐语义模型25-28
- 3.2.1 建模思路25-26
- 3.2.2 模型总体设计26-28
- 3.3 模型详解28-31
- 3.3.1 在线回归及基于特征的偏移28-29
- 3.3.2 降秩回归29-30
- 3.3.3 同步学习用户和项目因子30-31
- 3.4 模型拟合31-33
- 3.4.1 线下模型拟合31-32
- 3.4.2 快速在线回归32-33
- 3.4.3 在线模型选择33
- 3.5 本章小结33-34
- 第四章 在线快速学习隐语义模型的新闻推荐系统实现34-44
- 4.1 推荐系统外围框架34
- 4.2 推荐系统模型构建34-36
- 4.2.1 用户偏好模型35
- 4.2.2 新闻隐类模型35-36
- 4.2.3 隐类偏好模型计算36
- 4.3 推荐系统处理流程36-42
- 4.3.1 样本采集模块36-37
- 4.3.2 模型训练模块37-41
- 4.3.3 推荐计算模块41
- 4.3.4 新闻推荐列表生成更新41-42
- 4.4 新闻推荐生成42
- 4.4.1 匹配度计算42
- 4.4.2 时效权值排序42
- 4.5 本章小结42-44
- 第五章 新闻推荐系统实验评估44-51
- 5.1 My Yahoo!数据集44-47
- 5.1.1 数据44
- 5.1.2 模型44-45
- 5.1.3 性能指标45-46
- 5.1.4 实验结果46-47
- 5.1.5 在线模型选择的有效性47
- 5.2 MoiveLens数据集47-50
- 5.2.1 数据48
- 5.2.2 模型48
- 5.2.3 数据集分割48-49
- 5.2.4 实验结果49-50
- 5.3 本章小结50-51
- 第六章 总结与展望51-53
- 参考文献53-56
- 附录1 攻读硕士学位期间申请的专利56-57
- 致谢57
【相似文献】
中国期刊全文数据库 前10条
1 张大鹏,周军锋,陈宝峰;一种结合外部环境状态的主体语义模型[J];燕山大学学报;2005年04期
2 王煜;周立柱;邢春晓;;视频语义模型及评价准则[J];计算机学报;2007年03期
3 赵正利;王国宇;籍芳;;一种基于相关反馈的图像内在语义模型[J];微计算机信息;2007年24期
4 黄睿航;张园园;黄思沛;;基于语义模型的网络社群学习指导策略初探[J];无线互联科技;2013年06期
5 曹化工,秦友淑;工程信息结构的语义模型[J];计算机辅助设计与图形学学报;1996年01期
6 吕琳,孟祥旭,徐延宁;复杂产品的层次语义模型研究[J];中国机械工程;2004年15期
7 李晓建,陈磊,陈世鸿;教育资源语义模型研究[J];武汉大学学报(理学版);2005年03期
8 杨俊柯;杨贯中;杨建学;;基于语义模型的信息检索机制研究[J];计算机工程;2006年12期
9 董小峰;张树生;赵寒;周竞涛;冯峗;田占强;;基于语义模型的企业数据检索[J];制造技术与机床;2006年09期
10 王克飞;张树生;周竞涛;赵寒;;语义模型驱动的数据属性匹配技术研究[J];计算机应用研究;2006年10期
中国重要会议论文全文数据库 前5条
1 宋春阳;;从字到字组的语义解释模型[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 张辉;宋晓;张霖;;面向数字化设计的产品共享信息语义模型研究[A];全国先进制造技术高层论坛暨第八届制造业自动化与信息化技术研讨会论文集[C];2009年
3 王煜;周立柱;邢春晓;;SemTTe:针对具有结构化时态与类型化事件的视频的语义模型[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 魏勇;欧阳峰;陈刚;;基于语义的虚拟场景编辑系统设计[A];Proceedings of 14th Chinese Conference on System Simulation Technology & Application(CCSSTA’2012)[C];2012年
5 王煜;周立柱;邢春晓;;视频语义模型SemTTE及其查询语言VSQL[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国博士学位论文全文数据库 前4条
1 李学宁;现代汉语形容词概念语义模型研究[D];上海交通大学;2008年
2 石跃祥;计算机视觉图像语义模型的描述方法研究[D];中南大学;2005年
3 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
4 余卫宇;几种图像结构语义模型和图像[D];华南理工大学;2005年
中国硕士学位论文全文数据库 前10条
1 胡海彪;鱼类目标三维空间行为语义模型研究[D];浙江工业大学;2015年
2 周磊;基于在线快速学习隐语义模型的个性化新闻推荐[D];南京邮电大学;2015年
3 杜百玲;服务组装的可信语义模型的研究[D];哈尔滨工程大学;2009年
4 孙聪凯;语义模型、近似推理算法及其在网页分类的应用[D];上海交通大学;2009年
5 张巧霞;基于产品符号语义模型的设计定制信息处理方法及应用研究[D];河北工业大学;2011年
6 鲁权;基于协同过滤模型与隐语义模型的推荐系统研究与实现[D];湖南大学;2013年
7 王克飞;面向企业异构数据源集成的语义模型及进化技术研究[D];西北工业大学;2006年
8 肖雅夫;基于语义模型的高校舆情监测技术的研究[D];湖北工业大学;2014年
9 冯彩宁;Haskell语言类型推理的语义模型研究[D];宁夏大学;2013年
10 杨佳;专家信息语义模型异构数据转换技术研究[D];中南大学;2010年
本文关键词:基于在线快速学习隐语义模型的个性化新闻推荐,由笔耕文化传播整理发布。
本文编号:468105
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/468105.html