类别不平衡学习方法及其在Android恶意应用检测中的应用
发布时间:2023-03-27 04:13
随着移动设备的普及和移动应用用户数量的爆发式增长,移动智能终端安全面临着巨大挑战。机器学习作为人工智能领域的重要方法,近年来在通过分析网络行为进行移动恶意应用检测的研究中得到了广泛应用。然而,由于网络流量天然存在的类别分布不平衡特性和持续到达特性,给机器学习模型训练带来了诸多困难与挑战。首先,在真实环境中,正常行为的网络流量数量要远远多于恶意行为的网络流量数量,这种类别不均匀分布的数据集使得传统的基于数据集类别均匀分布假设所设计的分类算法无法达到预期的分类效果。其次,网络流量每时每刻源源不断地产生,数据规模越来越大,给机器学习模型构建带来了巨大困难。本文针对基于网络流量进行的Android恶意应用检测领域中遇到的上述关键问题,从普适的类别不平衡学习方法入手,到Android恶意应用检测领域中特有的类别不平衡学习方法,最后到大数据环境下的类别不平衡学习方法,由简入繁,系统地开展了以下研究工作:(1)针对于类别不平衡学习问题,提出一个基于自适应加权和高斯概率密度函数的过采样算法。该算法通过分析位置和样本数量两种因素,给每一个少数类样本分配不同的权重,然后根据此权重,结合高斯概率密度函数,合...
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 研究内容和创新点
1.4 论文组织结构
第二章 相关研究综述
2.1 类别不平衡学习问题
2.1.1 问题定义
2.1.2 评价策略
2.1.3 类别不平衡学习方法
2.2 大数据环境下的类别不平衡学习方法
2.3 本章小结
第三章 基于自适应加权和高斯密度概率函数的过采样模型
3.1 相关研究
3.2 模型描述
3.2.1 少数类样本加权
3.2.2 合成少数类样本
3.2.3 数据清洗
3.2.4 案例学习
3.3 模型性能评估与实验
3.3.1 实验数据
3.3.2 实验参数
3.3.3 结果与分析
3.4 类别不平衡Android恶意应用检测实验
3.4.1 实验数据
3.4.2 结果与分析
3.5 本章小结
第四章 基于多样性测量和PBIL进化的类别不平衡学习方法
4.1 相关研究
4.1.1 Q统计量
4.1.2 EUSBoost
4.2 模型描述
4.2.1 基于样本欧式距离的多样性评估算法
4.2.2 基于PBIL的进化欠采样算法
4.2.3 自适应加权投票策略
4.3 模型性能评估与实验
4.3.1 实验数据
4.3.2 实验参数
4.3.3 多样性评估算法性能评估与分析
4.3.4 类别不平衡集成学习模型性能评估与分析
4.4 类别不平衡Android恶意应用检测实验
4.5 本章小结
第五章 基于signature辅助的随机过采样模型
5.1 研究背景
5.2 模型描述
5.2.1 基于HTTP协议的网络行为聚类
5.2.2 signature提取
5.2.3 HTTP请求头URL模拟
5.2.4 Android恶意应用检测模型构建
5.3 模型性能评估与实验
5.3.1 实验数据
5.3.2 实验参数
5.3.3 结果与分析
5.4 本章小结
第六章 基于分布式框架的类别不平衡学习模型
6.1 相关研究
6.1.1 分布式平台框架
6.1.2 分布式类别不平衡学习模型相关研究
6.2 模型描述
6.2.1 模型构建
6.2.2 模型测试
6.3 模型评估与实验
6.3.1 实验环境
6.3.2 实验数据
6.3.3 实验参数
6.3.4 结果与分析
6.4 本章小结
第七章 结论与展望
参考文献
致谢
附录
本文编号:3772367
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 研究内容和创新点
1.4 论文组织结构
第二章 相关研究综述
2.1 类别不平衡学习问题
2.1.1 问题定义
2.1.2 评价策略
2.1.3 类别不平衡学习方法
2.2 大数据环境下的类别不平衡学习方法
2.3 本章小结
第三章 基于自适应加权和高斯密度概率函数的过采样模型
3.1 相关研究
3.2 模型描述
3.2.1 少数类样本加权
3.2.2 合成少数类样本
3.2.3 数据清洗
3.2.4 案例学习
3.3 模型性能评估与实验
3.3.1 实验数据
3.3.2 实验参数
3.3.3 结果与分析
3.4 类别不平衡Android恶意应用检测实验
3.4.1 实验数据
3.4.2 结果与分析
3.5 本章小结
第四章 基于多样性测量和PBIL进化的类别不平衡学习方法
4.1 相关研究
4.1.1 Q统计量
4.1.2 EUSBoost
4.2 模型描述
4.2.1 基于样本欧式距离的多样性评估算法
4.2.2 基于PBIL的进化欠采样算法
4.2.3 自适应加权投票策略
4.3 模型性能评估与实验
4.3.1 实验数据
4.3.2 实验参数
4.3.3 多样性评估算法性能评估与分析
4.3.4 类别不平衡集成学习模型性能评估与分析
4.4 类别不平衡Android恶意应用检测实验
4.5 本章小结
第五章 基于signature辅助的随机过采样模型
5.1 研究背景
5.2 模型描述
5.2.1 基于HTTP协议的网络行为聚类
5.2.2 signature提取
5.2.3 HTTP请求头URL模拟
5.2.4 Android恶意应用检测模型构建
5.3 模型性能评估与实验
5.3.1 实验数据
5.3.2 实验参数
5.3.3 结果与分析
5.4 本章小结
第六章 基于分布式框架的类别不平衡学习模型
6.1 相关研究
6.1.1 分布式平台框架
6.1.2 分布式类别不平衡学习模型相关研究
6.2 模型描述
6.2.1 模型构建
6.2.2 模型测试
6.3 模型评估与实验
6.3.1 实验环境
6.3.2 实验数据
6.3.3 实验参数
6.3.4 结果与分析
6.4 本章小结
第七章 结论与展望
参考文献
致谢
附录
本文编号:3772367
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3772367.html