淘宝商品个性化推荐算法的研究

发布时间:2022-12-22 00:46
  大数据时代的来临,使得信息过载现象日益明显。推荐系统的产生与不断发展有效缓解了这一问题。但是,随着人们生活质量的提升,个性化的需求凸显出来,如何针对不同顾客的个性化需求进行精准的推荐,成了当今研究的热门话题。本文将针对这一问题,对个性化推荐算法进行研究,并提出了两种针对不同数据集情况下的个性化推荐模型。主要研究内容如下:针对淘宝平台中有评语的小样本行为数据集进行推荐时,往往存在数据集的不平衡和样本稀疏问题。针对不平衡数据集分类问题提出一种新的模型,该模型首先对不平衡数据集中的在决策边界的少类样本利用TSMOTE算法进行循环合成,然后将新合成的少类样本集与决策边界外合成的少类样本集合并,以此进行过采样处理,从而提高少数类样本的重要度;其次,对于SVM在分类过程中由于数据不平衡导致的训练时超平面偏移现象,将DEC算法作为分类器的分类算法,并利用客观的标准差选取惩罚系数,提高了分类算法的性能。为了降低数据集稀疏性,本文引入KNN与改进的SVM混合来进行预测,该模型首先通过二分类得到得到“喜欢”和“不喜欢”两类。再通过KNN与SVM混合的协同过滤分类模型进行SVM多分类评分预测,最后进行Top... 

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 课题背景
    1.2 选题目的及意义
    1.3 国内外研究现状
    1.4 主要研究内容
    1.5 论文章节安排
2 个性化推荐相关技术及模型分析
    2.1 文本分类概述
        2.1.1 文本分类过程
        2.1.2 中文分词
        2.1.3 文本特征降维
        2.1.4 文本分类算法
        2.1.5 情感分析
    2.2 集成学习相关技术
        2.2.1 集成学习概述
        2.2.2 Boosting算法
    2.3 个性化推荐算法
        2.3.1 基于内容过滤的推荐算法
        2.3.2 基于用户的相似推荐
        2.3.3 ItemCF和UserCF的比较
    2.4 本文模型的需求分析
    2.5 本章小结
3 基于商品评价改进的推荐模型
    3.1 不平衡数据集分类
    3.2 商品评语数据集的不平衡性
    3.3 改进的LBT-SMOTE过采样算法
        3.3.1 L-SMOTE算法
        3.3.2 B-SMOTE算法
        3.3.3 TSMOTE算法
        3.3.4 LBT-SMOTE过采样算法
    3.4 基于标准差的DEC分类算法的优化方法
        3.4.1 支持向量机
        3.4.2 改进的DEC算法
    3.5 基于改进的KNN-SVM混合协同过滤推荐算法
        3.5.1 原始用户项目-评分矩阵
        3.5.2 推荐算法模型描述
    3.6 实验分析
        3.6.1 实验数据
        3.6.2 实验评价指标
        3.6.3 实验结果与分析
    3.7 本章小结
4 基于用户行为的改进的推荐模型
    4.1 实验数据准备
        4.1.1 实验数据来源
        4.1.2 数据预处理
        4.1.3 特征的设计与提取
    4.2 相关算法原理及模型介绍
        4.2.1 基于时间上下文的UserCF推荐
        4.2.2 Xgboost算法
    4.3 基于Xgboost的推荐算法模型构建
        4.3.1 基于Xgboost框架的推荐
    4.4 实验结果及分析
        4.4.1 实验环境
        4.4.2 实验评价指标
        4.4.3 实验结果与分析
    4.5 本章小结
结论
参考文献
附录
攻读学位期间发表的学术论文
致谢


【参考文献】:
期刊论文
[1]个性化推荐系统的研究进展[J]. 刘建国,周涛,汪秉宏.  自然科学进展. 2009(01)
[2]支持向量机理论与算法研究综述[J]. 丁世飞,齐丙娟,谭红艳.  电子科技大学学报. 2011(01)
[3]基于信息熵理论的综合评价方法[J]. 周薇,李筱菁.  科学技术与工程. 2010(23)
[4]欠采样与过采样技术研究[J]. 陈云,韦天焕.  信息通信. 2015(04)
[5]梯度渐进回归树算法在电子商务品牌推荐中的应用[J]. 申端明,乔德新,许琨,林霞,江日念.  计算机系统应用. 2015(06)
[6]基于排序学习的推荐算法研究综述[J]. 黄震华,张佳雯,田春岐,孙圣力,向阳.  软件学报. 2016(03)
[7]机器学习算法在数据挖掘中的应用[J]. 朱天元.  数字技术与应用. 2017(03)
[8]基于模糊数学理论的压滤车间绩效评价模型[J]. 高建,张立海,朱再胜.  选煤技术. 2016(01)
[9]基于改进SMOTE的小额贷款公司客户信用风险非均衡SVM分类[J]. 衣柏衡,朱建军,李杰.  中国管理科学. 2016(03)
[10]离散神经网络求解支持向量机中的凸优化问题[J]. 刘凤秋,张红旭.  哈尔滨理工大学学报. 2018(04)

硕士论文
[1]基于支持向量机的Top-N协同过滤推荐算法研究[D]. 张宇.山西大学 2016
[2]在线学习系统中的深度学习推荐算法研究[D]. 沈筱譞.华中师范大学 2017
[3]基于SVD与SVM混合推荐的电影推荐系统的研究[D]. 薄慧丽.太原理工大学 2017
[4]基于集成学习的移动电商用户个性化推荐[D]. 周俊锋.华南理工大学 2016
[5]基于异质信息网络的深度学习推荐算法研究[D]. 温玉娇.东北师范大学 2019



本文编号:3723095

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3723095.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e4271***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com