多目标进化聚类算法及其在信用风险管理的应用
发布时间:2021-10-21 00:28
中国金融行业的飞速发展和金融数据的爆炸式增长衍生出了对金融领域数据挖掘技术的探索需求。尤其在信用风险管理领域,传统的专家系统方法具有较高的主观性,一般性的判别方法难以应对日益复杂的高维数据,而各类数据挖掘技术展现出了客观性和准确性的优势。聚类分析是一种重要的无监督式数据挖掘技术,能够在没有训练样本的情况下,通过数据内部的联系识别横截面维度和时间维度上各类样本的特征,对信用风险评价问题和信用风险联动性分析问题具有较强的适用性。然而现有聚类算法在处理高维信用风险数据时存在聚类目标函数单一、算法鲁棒性较差、易陷入局部最优等不足。针对这些问题,提出了一种面向信用风险高维数据的聚类算法,并将其应用于截面数据和时间序列数据两种数据类型的信用风险管理问题的研究中。具体进行了如下工作:提出基于参考向量的多目标进化聚类算法(Reference Vector-based MultiObjective Clustering,RVMOC)。借鉴子空间聚类思想,建立针对信用风险高维数据聚类的多目标优化问题,并采用进化算法求解。在算法中设计了基于参考向量的局部搜索方法以提高算法准确性,提出了基于集成聚类的最终解选...
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:96 页
【学位级别】:硕士
【部分图文】:
RI指标下基于集成聚类的最终解选择方法效果测试Fig.3-6Effectivenessoftheknee-pruningfuzzyensembleunderRImetric
0 0.2 0.4 0.6 0.8 10 0.05 0.1 0.15 0.2图 3-7 NMI 指标下基于集成聚类的最终解选择方法效果测试Fig. 3-7 Effectiveness of the knee-pruning fuzzy ensemble under NMI metric从图 3-6 和图 3-7 可以看出,本文提出的最终解选择方法在各个数据集上均最优。对比方法中,膝盖方法在大多数数据上能够取得仅次于本文提出的基成聚类的最终解选择方法的结果,但结果中往往会得到较高的标准差,这是最后一代的帕累托解集中,可能存在不止一个膝盖区域,好的聚类结果不一是存在于某一个膝盖区域中;普通集成聚类方法在获得高鲁棒性的解方面具势,但其结果的准确性往往偏低,这是由于该方法综合了最后一代所有的解息得到了最终的结果,这种方法趋于获得稳定的解,但最后一代解集中既包秀的解,也可能包含较差的解,使得集成后的解的表现一般;最小d1方法在据集上表现较为平均,该方法的思路是找到距离理想点(即原点)最近的解最终解,但是在聚类算法中,这样的解并不一定能够代表各目标函数的最佳。本文提出的基于集成聚类的最终解选择方法首先利用膝盖方法对最后一代进行精炼,保留各膝盖区域的优秀解,筛除了较差解。并且,为保证算法的
0 0.2 0.4 0.6 0.8 10 0.05 0.1 0.15 0.2图 3-7 NMI 指标下基于集成聚类的最终解选择方法效果测试Fig. 3-7 Effectiveness of the knee-pruning fuzzy ensemble under NMI metric从图 3-6 和图 3-7 可以看出,本文提出的最终解选择方法在各个数据集上均最优。对比方法中,膝盖方法在大多数数据上能够取得仅次于本文提出的基成聚类的最终解选择方法的结果,但结果中往往会得到较高的标准差,这是最后一代的帕累托解集中,可能存在不止一个膝盖区域,好的聚类结果不一是存在于某一个膝盖区域中;普通集成聚类方法在获得高鲁棒性的解方面具势,但其结果的准确性往往偏低,这是由于该方法综合了最后一代所有的解息得到了最终的结果,这种方法趋于获得稳定的解,但最后一代解集中既包秀的解,也可能包含较差的解,使得集成后的解的表现一般;最小d1方法在据集上表现较为平均,该方法的思路是找到距离理想点(即原点)最近的解最终解,但是在聚类算法中,这样的解并不一定能够代表各目标函数的最佳。本文提出的基于集成聚类的最终解选择方法首先利用膝盖方法对最后一代进行精炼,保留各膝盖区域的优秀解,筛除了较差解。并且,为保证算法的
本文编号:3447887
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:96 页
【学位级别】:硕士
【部分图文】:
RI指标下基于集成聚类的最终解选择方法效果测试Fig.3-6Effectivenessoftheknee-pruningfuzzyensembleunderRImetric
0 0.2 0.4 0.6 0.8 10 0.05 0.1 0.15 0.2图 3-7 NMI 指标下基于集成聚类的最终解选择方法效果测试Fig. 3-7 Effectiveness of the knee-pruning fuzzy ensemble under NMI metric从图 3-6 和图 3-7 可以看出,本文提出的最终解选择方法在各个数据集上均最优。对比方法中,膝盖方法在大多数数据上能够取得仅次于本文提出的基成聚类的最终解选择方法的结果,但结果中往往会得到较高的标准差,这是最后一代的帕累托解集中,可能存在不止一个膝盖区域,好的聚类结果不一是存在于某一个膝盖区域中;普通集成聚类方法在获得高鲁棒性的解方面具势,但其结果的准确性往往偏低,这是由于该方法综合了最后一代所有的解息得到了最终的结果,这种方法趋于获得稳定的解,但最后一代解集中既包秀的解,也可能包含较差的解,使得集成后的解的表现一般;最小d1方法在据集上表现较为平均,该方法的思路是找到距离理想点(即原点)最近的解最终解,但是在聚类算法中,这样的解并不一定能够代表各目标函数的最佳。本文提出的基于集成聚类的最终解选择方法首先利用膝盖方法对最后一代进行精炼,保留各膝盖区域的优秀解,筛除了较差解。并且,为保证算法的
0 0.2 0.4 0.6 0.8 10 0.05 0.1 0.15 0.2图 3-7 NMI 指标下基于集成聚类的最终解选择方法效果测试Fig. 3-7 Effectiveness of the knee-pruning fuzzy ensemble under NMI metric从图 3-6 和图 3-7 可以看出,本文提出的最终解选择方法在各个数据集上均最优。对比方法中,膝盖方法在大多数数据上能够取得仅次于本文提出的基成聚类的最终解选择方法的结果,但结果中往往会得到较高的标准差,这是最后一代的帕累托解集中,可能存在不止一个膝盖区域,好的聚类结果不一是存在于某一个膝盖区域中;普通集成聚类方法在获得高鲁棒性的解方面具势,但其结果的准确性往往偏低,这是由于该方法综合了最后一代所有的解息得到了最终的结果,这种方法趋于获得稳定的解,但最后一代解集中既包秀的解,也可能包含较差的解,使得集成后的解的表现一般;最小d1方法在据集上表现较为平均,该方法的思路是找到距离理想点(即原点)最近的解最终解,但是在聚类算法中,这样的解并不一定能够代表各目标函数的最佳。本文提出的基于集成聚类的最终解选择方法首先利用膝盖方法对最后一代进行精炼,保留各膝盖区域的优秀解,筛除了较差解。并且,为保证算法的
本文编号:3447887
本文链接:https://www.wllwen.com/guanlilunwen/fengxianguanli/3447887.html