面向金融数据的异常检测方法研究
发布时间:2021-05-08 15:23
针对当前异常检测算法在处理时序性、不均衡的海量金融数据集时存在准确率低、误警率高等问题,本文从特征选择、不均衡分类等方面进行研究,提出一种基于条件动态互信息的金融数据特征选择算法、一种基于隔离森林的金融数据异常检测算法、一种基于SVM和KNN的金融数据异常检测算法。本文主要的研究工作和成果如下:1.针对特征选择算法在处理海量时序性数据集时,评价标准衡量因素片面化得不到最优特征子集问题,研究提出一种基于条件动态互信息的金融数据特征选择算法CDMIFS,该算法结合数据的时序性特点,从多方面衡量候选特征,在未识别样本上以条件动态互信息度量特征与异常类的相关性来获取特征子集。实验结果表明该方法可有效去除金融数据集中不相关数据,提高分类性能。2.针对隔离森林节点划分的随机性造成异常检测准确率低、误警率高的问题,研究提出一种基于异常代价信息增益率的节点划分标准,并根据该标准提出一种基于隔离森林的金融数据异常检测算法FA-iForest。该划分标准考虑属性在历史数据中与异常类别的加权信息熵,同时设置代价函数加大异常类误判的惩罚。实验结果表明,该算法可有效提高隔离森林对金融数据的异常检测能力。3.针对...
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:101 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 课题研究背景和意义
1.2 课题研究现状
1.2.1 金融数据异常检测
1.2.2 基于隔离森林的异常检测算法
1.2.3 基于支持向量机的异常检测算法
1.2.4 基于K近邻的异常检测算法
1.2.5 特征选择算法在异常检测领域的运用
1.3 主要研究内容
1.4 论文组织结构
第2章 相关理论基础
2.1 金融数据预处理
2.1.1 数据准备
2.1.2 数据清洗
2.1.3 特征选择
2.1.4 数据转换
2.2 特征选择算法
2.3 隔离森林算法
2.4 支持向量机
2.5 K近邻算法
2.6 本章小结
第3章 基于条件动态互信息的金融数据特征选择算法及在异常检测的运用
3.1 引言
3.2 基于互信息的特征选择算法研究现状
3.3 基于条件动态互信息的特征选择算法及其在异常检测的运用
3.3.1 相关定义
3.3.2 基于条件动态互信息的金融数据特征选择算法
3.3.3 基于CDMIFS的异常检测算法
3.4 实验结果与分析
3.4.1 实验数据集
3.4.2 数据集预处理
3.4.3 评价指标
3.4.4 实验设计与结果分析
3.5 本章小结
第4章 基于隔离森林的金融数据异常检测算法
4.1 引言
4.2 隔离森林节点划分规则研究
4.3 基于隔离森林的金融数据异常检测算法
4.3.1 相关定义
4.3.2 基于隔离森林的金融数据异常检测算法
4.4 实验结果与分析
4.4.1 实验数据集
4.4.2 数据集预处理
4.4.3 实验设计与结果分析
4.5 本章小结
第5章 基于SVM和 KNN的金融数据异常检测算法
5.1 引言
5.2 SVM算法
5.3 KNN算法
5.4 基于SVM和 KNN的金融数据异常检测算法
5.4.1 相关定义
5.4.2 基于SVM和 KNN的金融数据异常检测算法
5.5 实验结果分析
5.5.1 实验数据集
5.5.2 数据集预处理
5.5.3 实验设计与结果分析
5.6 本章小结
第6章 总结与展望
6.1 本文工作总结
6.2 未来研究展望
致谢
参考文献
攻读学位期间的研究成果
【参考文献】:
期刊论文
[1]基于新改进的SVM不平衡数据集分类算法[J]. 刘悦婷,李晓霞,李思璇,朱旭博. 石河子大学学报(自然科学版). 2018(05)
[2]基于Isolation Forest改进的数据异常检测方法[J]. 徐东,王岩俊,孟宇龙,张子迎. 计算机科学. 2018(10)
[3]适用于不平衡数据集分类的改进SVM算法[J]. 刘东启,陈志坚,徐银,李飞腾. 传感器与微系统. 2018(03)
[4]基于互信息的特征选择在入侵检测中的优化[J]. 刘云,向婵,王海花. 西北大学学报(自然科学版). 2017(05)
[5]基于瀑布型混合技术的异常检测算法[J]. 王茹雪,张丽翠,刘姝岐. 吉林大学学报(信息科学版). 2017(05)
[6]一种融合Kmeans和KNN的网络入侵检测算法[J]. 华辉有,陈启买,刘海,张阳,袁沛权. 计算机科学. 2016(03)
[7]An Isolation Principle Based Distributed Anomaly Detection Method in Wireless Sensor Networks[J]. Zhi-Guo Ding,Da-Jun Du,Min-Rui Fei. International Journal of Automation and Computing. 2015(04)
[8]基于SVM的网络入侵检测集成学习算法[J]. 谭爱平,陈浩,吴伯桥. 计算机科学. 2014(02)
[9]基于修正核函数SVM的网络入侵检测[J]. 井小沛,汪厚祥,聂凯. 系统工程与电子技术. 2012(05)
[10]特征选择方法综述[J]. 姚旭,王晓丹,张玉玺,权文. 控制与决策. 2012(02)
博士论文
[1]基于信息熵的特征选择算法研究[D]. 刘华文.吉林大学 2010
硕士论文
[1]无监督异常检测方法研究及其应用[D]. 刘鑫.电子科技大学 2018
[2]基于集成学习算法的异常检测研究[D]. 陈飞宇.南京大学 2015
[3]特征选择算法研究及其在异常检测中的应用[D]. 王丹.电子科技大学 2014
[4]基于计算智能的金融数据异常发现[D]. 王静.西南交通大学 2011
[5]SVDD算法研究及在信用卡欺诈检测中的应用[D]. 刘艳红.江苏大学 2010
[6]基于SVM-KNN的商业银行信用风险模型研究[D]. 冯晓阳.天津大学 2008
[7]基于支持向量机的信用卡欺诈检测研究[D]. 杨玺.四川师范大学 2008
本文编号:3175571
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:101 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 课题研究背景和意义
1.2 课题研究现状
1.2.1 金融数据异常检测
1.2.2 基于隔离森林的异常检测算法
1.2.3 基于支持向量机的异常检测算法
1.2.4 基于K近邻的异常检测算法
1.2.5 特征选择算法在异常检测领域的运用
1.3 主要研究内容
1.4 论文组织结构
第2章 相关理论基础
2.1 金融数据预处理
2.1.1 数据准备
2.1.2 数据清洗
2.1.3 特征选择
2.1.4 数据转换
2.2 特征选择算法
2.3 隔离森林算法
2.4 支持向量机
2.5 K近邻算法
2.6 本章小结
第3章 基于条件动态互信息的金融数据特征选择算法及在异常检测的运用
3.1 引言
3.2 基于互信息的特征选择算法研究现状
3.3 基于条件动态互信息的特征选择算法及其在异常检测的运用
3.3.1 相关定义
3.3.2 基于条件动态互信息的金融数据特征选择算法
3.3.3 基于CDMIFS的异常检测算法
3.4 实验结果与分析
3.4.1 实验数据集
3.4.2 数据集预处理
3.4.3 评价指标
3.4.4 实验设计与结果分析
3.5 本章小结
第4章 基于隔离森林的金融数据异常检测算法
4.1 引言
4.2 隔离森林节点划分规则研究
4.3 基于隔离森林的金融数据异常检测算法
4.3.1 相关定义
4.3.2 基于隔离森林的金融数据异常检测算法
4.4 实验结果与分析
4.4.1 实验数据集
4.4.2 数据集预处理
4.4.3 实验设计与结果分析
4.5 本章小结
第5章 基于SVM和 KNN的金融数据异常检测算法
5.1 引言
5.2 SVM算法
5.3 KNN算法
5.4 基于SVM和 KNN的金融数据异常检测算法
5.4.1 相关定义
5.4.2 基于SVM和 KNN的金融数据异常检测算法
5.5 实验结果分析
5.5.1 实验数据集
5.5.2 数据集预处理
5.5.3 实验设计与结果分析
5.6 本章小结
第6章 总结与展望
6.1 本文工作总结
6.2 未来研究展望
致谢
参考文献
攻读学位期间的研究成果
【参考文献】:
期刊论文
[1]基于新改进的SVM不平衡数据集分类算法[J]. 刘悦婷,李晓霞,李思璇,朱旭博. 石河子大学学报(自然科学版). 2018(05)
[2]基于Isolation Forest改进的数据异常检测方法[J]. 徐东,王岩俊,孟宇龙,张子迎. 计算机科学. 2018(10)
[3]适用于不平衡数据集分类的改进SVM算法[J]. 刘东启,陈志坚,徐银,李飞腾. 传感器与微系统. 2018(03)
[4]基于互信息的特征选择在入侵检测中的优化[J]. 刘云,向婵,王海花. 西北大学学报(自然科学版). 2017(05)
[5]基于瀑布型混合技术的异常检测算法[J]. 王茹雪,张丽翠,刘姝岐. 吉林大学学报(信息科学版). 2017(05)
[6]一种融合Kmeans和KNN的网络入侵检测算法[J]. 华辉有,陈启买,刘海,张阳,袁沛权. 计算机科学. 2016(03)
[7]An Isolation Principle Based Distributed Anomaly Detection Method in Wireless Sensor Networks[J]. Zhi-Guo Ding,Da-Jun Du,Min-Rui Fei. International Journal of Automation and Computing. 2015(04)
[8]基于SVM的网络入侵检测集成学习算法[J]. 谭爱平,陈浩,吴伯桥. 计算机科学. 2014(02)
[9]基于修正核函数SVM的网络入侵检测[J]. 井小沛,汪厚祥,聂凯. 系统工程与电子技术. 2012(05)
[10]特征选择方法综述[J]. 姚旭,王晓丹,张玉玺,权文. 控制与决策. 2012(02)
博士论文
[1]基于信息熵的特征选择算法研究[D]. 刘华文.吉林大学 2010
硕士论文
[1]无监督异常检测方法研究及其应用[D]. 刘鑫.电子科技大学 2018
[2]基于集成学习算法的异常检测研究[D]. 陈飞宇.南京大学 2015
[3]特征选择算法研究及其在异常检测中的应用[D]. 王丹.电子科技大学 2014
[4]基于计算智能的金融数据异常发现[D]. 王静.西南交通大学 2011
[5]SVDD算法研究及在信用卡欺诈检测中的应用[D]. 刘艳红.江苏大学 2010
[6]基于SVM-KNN的商业银行信用风险模型研究[D]. 冯晓阳.天津大学 2008
[7]基于支持向量机的信用卡欺诈检测研究[D]. 杨玺.四川师范大学 2008
本文编号:3175571
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/3175571.html