基于特征工程的协同过滤算法研究
发布时间:2024-04-25 23:07
协同过滤算法是目前应用最广泛、最成功的推荐算法之一,通过分析用户或项目特征计算相似度,生成最近邻集合,最后预测对未知项目的评分生成推荐结果。用户或项目特征在协同过滤算法中是至关重要的,其区分度和稀疏性会直接影响算法的预测准确度。无论是传统协同过滤算法还是改进的协同过滤算法,二者都是将评分数据作为用户或项目的特征,因此就有两个方面的问题需要进一步探索和优化:(1)用户或项目特征的区分度不高。评分数据在很大程度上受到用户个性化偏好、行为习惯等不可度量因素的影响,对于不同的用户来说,相同评分会代表不同偏好,而不同评分却可能代表相同的偏好。因此,将评分数据作为用户或项目特征就会存在特征区分度不高的问题。为了得到区分度更高的特征,研究者们会使用不同的方法,例如:基于内容的方法引入各种用户或项目特征、引入人口统计特征或结合自然语言处理技术等。(2)用户或项目特征具有高稀疏性。随着互联网用户规模的急速扩大和电子商务的普及,用户评分的项目通常只占全部项目的很少一部分,评分数据极度稀疏。此时,将评分数据作为用户或项目特征就会存在特征稀疏度高的问题。为了缓解稀疏性问题带来的影响,研究者们创新出了多种控制填...
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
本文编号:3964365
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图1-1主流社交应用使用率
第1章绪论第1章绪论.1研究背景及意义信息技术的高速发展,为人们日常生活中信息的获取提供了便捷途径,但不仅仅满足于获取信息,与此同时也在制造信息,传播信息。中国互联网络中心预2018年8月发布的第42中国互联网络发展状况统计报告[1]指出,截018年....
图1-2网络购物用户规模
每日都会花费数个小时进行网络即时通信、网络购物、APP应用等统计共有544万个网站和415万款APP,半年间制造、传播266亿GB的信如,观察图1-1中数据,随着微信朋友圈、QQ空间和微博等主流社交应用的使用,网络购物和手机购物的用户规模与日俱增,如图....
图2-5基于矩阵分解模型的协同过滤算法
图2-5基于矩阵分解模型的协同过滤算法为了训练矩阵分解模型,需要最小化损失函数,如下公式,然后可以使降等优化算对参数进行学习。min,在模型训练结束之后,通过公式还原评分矩阵。从矩阵中便可以得到对目的预测评分值。??=?(归因理论海德(FritzHeider)于1....
图2-6GBDT+LR模型
图2-6GBDT+LR模型2.4常用数据集及评价指标2.4.1常用数据集为评估文中提出的算法对准确度的提升程度,在三个Movielens[46]、Yahoo!WebscopeR4[47]、Filmtrust[48]。这究领域通用的数据集,采集的都是用户对项目的....
本文编号:3964365
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3964365.html
最近更新
教材专著