当前位置:主页 > 经济论文 > 经济发展论文 >

基于度量学习的最近邻信用评分模型研究

发布时间:2020-08-08 03:32
【摘要】:消费信贷是金融机构的一项重要业务,借贷融资和信用卡消费等理念已经普遍被中小企业和个人接受.在面对大量新借款客户的申请时,金融机构需要迅速作出批准或拒绝的决策,而决策的依据是对新申请客户进行信用评分.随着消费信贷业务的迅速发展,许多信用评分模型被提出并广泛应用于信用录取决策.例如,基于统计学方法的判别分析、Logistic回归分析和决策树等模型,基于人工智能方法的人工神经网络、支持向量机等模型.虽然这些模型在应用中有各自的优势,但也存在着一些局限性.而最近邻信用评分模型作为一个非参数模型,既不需要考虑数据分布的假设,也不需要引入参数,且还具有解决人口漂移问题的优点,虽然其应用依赖于度量的选择.因此,本文考虑利用度量学习方法,对最近邻信用评分模型进行研究.本学位论文主要对最近邻信用评分模型进行研究.模型中采用的度量是通过本文提出的度量学习方法而学习得到的,所设计的内蕴最速下降算法提升了所学度量的精确性,进而提高了最近邻信用评分模型的分类性能.本文的主要内容和创新点是:1.研究基于监督度量学习的最近邻信用评分模型.该模型中的度量是通过所提出的非线性监督度量学习方法而学习得到的,它能够更好地反映数据的分布情况,改进了欧氏距离在信用评分中受数据分布和数据特征变量影响较大的缺点,从而能提高信用评分的预测精度.其中用于学习度量的非线性监督度量学习方法所对应的优化问题,约束条件仅仅只有一个,可以转化为一个无约束的优化问题进行求解,避免了现有度量学习模型中约束条件过多而导致计算复杂的问题.2.通过分析约束条件的几何特征,将所提出的非线性监督度量学习对应的优化问题转化为流形上的无约束优化问题,从而设计了具有自适应最优迭代步长的内蕴最速下降算法.该算法在每次迭代时都能保证沿着流形上的点进行,解决了传统算法在求解时需要通过投影才能保证约束条件成立这一问题.这就减少了投影带来的计算代价和误差,有利于提高所学度量的精确性,进而能提高最近邻信用评分模型的性能.3.研究基于半监督度量学习的最近邻信用评分模型.该模型中的度量是通过我们提出的非线性半监督度量学习模型而学习得到的,它虽然是通过训练集中少量已知类别的客户数据而得到的,但是却能较好地反映训练集中全部数据的分布情况.这就使得在信用评分中,当新申请客户到来时,只需要计算与那些已知类别的客户之间的距离,无需计算与训练集中全部数据的距离.从而大大减少了最近邻信用评分模型在应用时的计算量.另外,用于学习度量的非线性半监督度量学习方法,是利用半监督学习和多核学习的理论提出的,它有两个优点:一是仅仅只需要知道训练集中少量的客户类别信息,这就减少了监督学习时金融机构为了对现有数据库中全部的客户进行类别标记所带来的代价;二是还能学习得到一个新的核函数,这就解决了传统非线性方法中关于核函数的选取问题.
【学位授予单位】:上海大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:F224
【图文】:

线性可分,支持向量机,二维空间,超平面


维空间中具有线性可分的性质,然后通过最大化两类数据之间的间隔找到一个分逡逑类超平面,从而得到一个分类器.利用此分类器可以实现对新的借款客户申请进行逡逑类别预测.图2.1给出二维空间上线性可分支持向量机的简单示意图,实线表示分逡逑类超平面,虚线表示支撑超平面.逡逑wTx+b邋=邋-1逡逑????逡逑?邋?邋?逡逑★邋★邋★邋\逡逑—★邋★逡逑图2.1:二维空间中的线性可分支持向量机逡逑

机器学习,形式,结构型


信息.机器学习的目的是专门让计算机自身通过数据或者以往经验等外部输入逡逑进行自身学习以改善系统自身的性能,从而达到对数据进行分类或聚类的目的.逡逑图2.2给出机器学习在分类和聚类中的简单示意图.逡逑小逦个逡逑★逦★逦★逦#性分类器逡逑?逦?逦机器学‘习逦?逦?逡逑★逦4逡逑?逦?逦?邋?逡逑逦>邋逦>逡逑个逡逑°逦°逦1/^:;聚类逡逑O逦O邋W逡逑0逦0逡逑逦^邋逦逦逦>逡逑图2.2:机器学习在分类和聚类中的简单示意图逡逑由图2.2可知,机器学习研究的主要对象就是“数据”.现实世界中的“数逡逑据”有多种出现形式,常见的形式有数值型数据(numerical邋data)和结构型数逡逑据(structure邋data)两种?图2.3给出了常见数据的形式.逡逑

数据类型,机器学习


信息.机器学习的目的是专门让计算机自身通过数据或者以往经验等外部输入逡逑进行自身学习以改善系统自身的性能,从而达到对数据进行分类或聚类的目的.逡逑图2.2给出机器学习在分类和聚类中的简单示意图.逡逑小逦个逡逑★逦★逦★逦#性分类器逡逑?逦?逦机器学‘习逦?逦?逡逑★逦4逡逑?逦?逦?邋?逡逑逦>邋逦>逡逑个逡逑°逦°逦1/^:;聚类逡逑O逦O邋W逡逑0逦0逡逑逦^邋逦逦逦>逡逑图2.2:机器学习在分类和聚类中的简单示意图逡逑由图2.2可知,机器学习研究的主要对象就是“数据”.现实世界中的“数逡逑据”有多种出现形式,常见的形式有数值型数据(numerical邋data)和结构型数逡逑据(structure邋data)两种?图2.3给出了常见数据的形式.逡逑

【参考文献】

相关期刊论文 前5条

1 陆爱国;王珏;刘红卫;;基于改进的SVM学习算法及其在信用评分中的应用[J];系统工程理论与实践;2012年03期

2 姜明辉;谢行恒;王树林;温潇;;个人信用评估的Logistic-RBF组合模型[J];哈尔滨工业大学学报;2007年07期

3 吴德胜,梁j;遗传算法优化神经网络及信用评价研究[J];中国管理科学;2004年01期

4 姜明辉,王雅林,赵欣,黄伟平;k-近邻判别分析法在个人信用评估中的应用[J];数量经济技术经济研究;2004年02期

5 石庆焱,靳云汇;个人信用评分的主要模型与方法综述[J];统计研究;2003年08期

相关博士学位论文 前3条

1 闫辛;半监督支持向量机模型与算法研究[D];上海大学;2016年

2 向晖;个人信用评分组合模型研究与应用[D];湖南大学;2011年

3 陈为民;基于支持向量机的信用卡信用风险管理模型与技术研究[D];湖南大学;2009年



本文编号:2784980

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjifazhanlunwen/2784980.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d7d4a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com