推荐系统中基于用户评分行为的欺诈攻击检测方法研究
发布时间:2022-10-15 17:59
协同过滤推荐系统作为缓解“信息过载”问题的有效手段,广泛应用于电子商务领域,在提升网站浏览量、商品转化率、顾客忠诚度等方面有非常重要的作用。但是,协同过滤推荐系统也有脆弱的一面,恶意用户在利益驱使下可以人为地向推荐系统注入大量虚假评分,达到影响或操纵推荐结果的目的。因此,如何检测出各类对协同过滤推荐系统造成威胁的欺诈攻击,保证推荐质量,保障推荐结果的可信性,是当前迫切需要解决的问题。本文基于用户的评分行为,从用户多源信息的特征提取、多视角集成检测、自动检测、基于用户关系图的检测等方面进行了深入研究。首先,针对单一信息源提取的检测特征不能全面刻画用户评分行为的问题,提出一种基于用户评分行为多源信息的特征提取方法。具体地,基于信息融合的思想,定义项目时间流行度,并采用小波变换方法过滤噪声和不稳定信号。从项目流行度和评分时间融合的角度提取4个用户特征;从用户评分的时延,利用修正的条件熵和“休眠-评分”模型,提取2个用户特征;从用户评分值和评分时间融合的角度提取2个用户特征;从不同流行项目集合的角度,提取10个用户特征。其次,针对检测特征的冗余问题和有监督检测中的不平衡分类问题,基于上述用户评...
【文章页数】:130 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 有监督检测方法
1.2.2 半监督检测方法
1.2.3 无监督检测方法
1.3 本文的主要研究内容
1.4 本文的组织结构
第2章 基于用户评分行为多源信息的特征提取方法
2.1 引言
2.2 项目时间流行度的相关定义
2.3 项目时间流行度的小波分解
2.4 基于项目时间流行度的特征提取
2.5 基于用户评分时延的特征提取
2.6 基于评分动态均值的特征提取
2.7 基于不同流行项目集合的特征提取
2.8 用户评分行为的特征提取算法
2.9 本章小结
第3章 基于最优特征子集划分的多视角集成检测方法
3.1 引言
3.2 相关理论
3.2.1 特征选择
3.2.2 多视角学习
3.2.3 支持向量机
3.2.4 集成学习
3.3 基于最优特征子集划分的多视角集成检测框架
3.4 多视角构建
3.5 多视角学习
3.6 多视角集成检测
3.7 欺诈攻击的多视角集成检测算法
3.8 本章小结
第4章 基于边缘降噪编码器的欺诈攻击自动检测方法
4.1 引言
4.2 相关理论
4.2.1 边缘降噪编码器
4.2.2 AdaBoost算法
4.3 基于边缘降噪编码器的检测框架
4.4 检测特征的自动提取
4.4.1 项目干扰噪声的确定
4.4.2 基于稀疏系数的低维特征提取
4.4.3 堆栈边缘线性降噪编码器的结构
4.5 基于边缘降噪编码器的自动检测算法
4.6 本章小结
第5章 基于用户关系图的无监督欺诈攻击检测方法
5.1 引言
5.2 相关理论
5.2.1 稀疏降噪自动编码器
5.2.2 社区发现
5.3 基于用户关系图的无监督检测框架
5.4 加权用户关系图的构建
5.5 基聚类结果的生成
5.6 欺诈攻击概貌的社区检测
5.7 基于用户关系图的无监督检测算法
5.8 本章小结
第6章 实验与评价
6.1 欺诈攻击模型与实验数据集
6.1.1 欺诈攻击模型
6.1.2 Netflix数据集
6.1.3 Amazon数据集
6.2 主要评价指标
6.3 实验设置与对比算法
6.3.1 实验设置
6.3.2 对比算法
6.4 基于最优特征子集划分的多视角集成检测方法性能评价
6.4.1 MVEDM-OFSP在各种攻击模型下的检测性能评价
6.4.2 MVEDM-OFSP的泛化性能评价
6.4.3 MVEDM-OFSP中人工特征的信息增益评价
6.4.4 MVEDM-OFSP与单一视角检测方法的对比
6.4.5 MVEDM-OFSP在实际中的检测性能评价
6.5 基于边缘降噪编码器的自动检测方法的性能评价
6.5.1 ADM-mSLDA在各种攻击模型下的检测性能评价
6.5.2 ADM-mSLDA的泛化性能评价
6.5.3 ADM-mSLDA在实际中的检测性能评价
6.6 基于用户关系图的无监督检测方法的性能评价
6.6.1 UDM-URG在各种攻击模型下的检测性能评价
6.6.2 UDM-URG在实际中的检测性能评价
6.7 算法运行时间的对比
6.8 本文所提方法的检测性能对比
6.8.1 在各种攻击模型下的检测性能评价
6.8.2 在实际应用中的检测性能评价
6.8.3 算法优缺点及适用场景
6.9 本章小结
结论
参考文献
攻读博士学位期间承担的科研任务与主要成果
致谢
【参考文献】:
期刊论文
[1]社交网络中基于模块度最大化的标签传播算法的研究[J]. 陈晶,万云. 通信学报. 2017(02)
[2]复杂网络大数据中重叠社区检测算法[J]. 乔少杰,韩楠,张凯峰,邹磊,王宏志,Louis Alberto GUTIERREZ. 软件学报. 2017(03)
[3]Boosting算法理论与应用研究[J]. 张文生,于廷照. 中国科学技术大学学报. 2016(03)
[4]基于仿生模式识别的未知推荐攻击检测[J]. 周全强,张付志,刘文远. 软件学报. 2014(11)
博士论文
[1]基于视角学习的分类算法研究[D]. 薛晓伟.浙江大学 2017
[2]基于可疑用户度量的鲁棒推荐方法研究[D]. 伊华伟.燕山大学 2016
[3]面向协同过滤的推荐攻击特征提取及集成检测方法研究[D]. 周全强.燕山大学 2013
[4]协同过滤推荐系统托攻击防御技术研究[D]. 李聪.国防科学技术大学 2012
硕士论文
[1]基于图正则低秩表示的基因表达谱数据特征选择算法研究[D]. 康乐乐.江西理工大学 2018
[2]基于激光雷达点云图像的目标识别方法研究[D]. 杨文辉.西安工业大学 2018
[3]基于粒子群优化的网络视频流特征选择与识别[D]. 冯茂.南京邮电大学 2017
本文编号:3691772
【文章页数】:130 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 有监督检测方法
1.2.2 半监督检测方法
1.2.3 无监督检测方法
1.3 本文的主要研究内容
1.4 本文的组织结构
第2章 基于用户评分行为多源信息的特征提取方法
2.1 引言
2.2 项目时间流行度的相关定义
2.3 项目时间流行度的小波分解
2.4 基于项目时间流行度的特征提取
2.5 基于用户评分时延的特征提取
2.6 基于评分动态均值的特征提取
2.7 基于不同流行项目集合的特征提取
2.8 用户评分行为的特征提取算法
2.9 本章小结
第3章 基于最优特征子集划分的多视角集成检测方法
3.1 引言
3.2 相关理论
3.2.1 特征选择
3.2.2 多视角学习
3.2.3 支持向量机
3.2.4 集成学习
3.3 基于最优特征子集划分的多视角集成检测框架
3.4 多视角构建
3.5 多视角学习
3.6 多视角集成检测
3.7 欺诈攻击的多视角集成检测算法
3.8 本章小结
第4章 基于边缘降噪编码器的欺诈攻击自动检测方法
4.1 引言
4.2 相关理论
4.2.1 边缘降噪编码器
4.2.2 AdaBoost算法
4.3 基于边缘降噪编码器的检测框架
4.4 检测特征的自动提取
4.4.1 项目干扰噪声的确定
4.4.2 基于稀疏系数的低维特征提取
4.4.3 堆栈边缘线性降噪编码器的结构
4.5 基于边缘降噪编码器的自动检测算法
4.6 本章小结
第5章 基于用户关系图的无监督欺诈攻击检测方法
5.1 引言
5.2 相关理论
5.2.1 稀疏降噪自动编码器
5.2.2 社区发现
5.3 基于用户关系图的无监督检测框架
5.4 加权用户关系图的构建
5.5 基聚类结果的生成
5.6 欺诈攻击概貌的社区检测
5.7 基于用户关系图的无监督检测算法
5.8 本章小结
第6章 实验与评价
6.1 欺诈攻击模型与实验数据集
6.1.1 欺诈攻击模型
6.1.2 Netflix数据集
6.1.3 Amazon数据集
6.2 主要评价指标
6.3 实验设置与对比算法
6.3.1 实验设置
6.3.2 对比算法
6.4 基于最优特征子集划分的多视角集成检测方法性能评价
6.4.1 MVEDM-OFSP在各种攻击模型下的检测性能评价
6.4.2 MVEDM-OFSP的泛化性能评价
6.4.3 MVEDM-OFSP中人工特征的信息增益评价
6.4.4 MVEDM-OFSP与单一视角检测方法的对比
6.4.5 MVEDM-OFSP在实际中的检测性能评价
6.5 基于边缘降噪编码器的自动检测方法的性能评价
6.5.1 ADM-mSLDA在各种攻击模型下的检测性能评价
6.5.2 ADM-mSLDA的泛化性能评价
6.5.3 ADM-mSLDA在实际中的检测性能评价
6.6 基于用户关系图的无监督检测方法的性能评价
6.6.1 UDM-URG在各种攻击模型下的检测性能评价
6.6.2 UDM-URG在实际中的检测性能评价
6.7 算法运行时间的对比
6.8 本文所提方法的检测性能对比
6.8.1 在各种攻击模型下的检测性能评价
6.8.2 在实际应用中的检测性能评价
6.8.3 算法优缺点及适用场景
6.9 本章小结
结论
参考文献
攻读博士学位期间承担的科研任务与主要成果
致谢
【参考文献】:
期刊论文
[1]社交网络中基于模块度最大化的标签传播算法的研究[J]. 陈晶,万云. 通信学报. 2017(02)
[2]复杂网络大数据中重叠社区检测算法[J]. 乔少杰,韩楠,张凯峰,邹磊,王宏志,Louis Alberto GUTIERREZ. 软件学报. 2017(03)
[3]Boosting算法理论与应用研究[J]. 张文生,于廷照. 中国科学技术大学学报. 2016(03)
[4]基于仿生模式识别的未知推荐攻击检测[J]. 周全强,张付志,刘文远. 软件学报. 2014(11)
博士论文
[1]基于视角学习的分类算法研究[D]. 薛晓伟.浙江大学 2017
[2]基于可疑用户度量的鲁棒推荐方法研究[D]. 伊华伟.燕山大学 2016
[3]面向协同过滤的推荐攻击特征提取及集成检测方法研究[D]. 周全强.燕山大学 2013
[4]协同过滤推荐系统托攻击防御技术研究[D]. 李聪.国防科学技术大学 2012
硕士论文
[1]基于图正则低秩表示的基因表达谱数据特征选择算法研究[D]. 康乐乐.江西理工大学 2018
[2]基于激光雷达点云图像的目标识别方法研究[D]. 杨文辉.西安工业大学 2018
[3]基于粒子群优化的网络视频流特征选择与识别[D]. 冯茂.南京邮电大学 2017
本文编号:3691772
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3691772.html