当前位置:主页 > 管理论文 > 货币论文 >

基于机器学习的农户信用评估研究

发布时间:2022-02-14 14:59
  “三农”问题一直以来都是党中央和国家高度重视的民生问题,近年来,在全面建成小康社会的政策指引下,国家精准扶贫的力度不断加大,贫困农户的生活也切实发生了变化,基本生活保障已经落实到位。然而,“三农”问题的关键还是农业问题,对于广大农户而言,发展农业经济依旧是脱贫致富的主要道路,而资金则是发展农业经济最为核心的要素,农户的资金来源相对有限,通过银行等金融信贷机构贷款仍然是他们获得资金的主要渠道,而农村金融体系相对比较薄弱,随之引发了“双难”问题,即农村金融信贷机构“难贷款”以及农户“贷款难”。这背后的主要原因是农户和金融信贷机构之间信息不对称,农村信用评估体系不完善,农村金融信贷机构不能准确客观对农户的信用作出评估,农户贷款违约率较高。因此,在这种背景下,探索一套适用于我国农户的科学统一的信用评估体系对于解决“双难”问题从而解决“三农”问题是十分有意义的。具体地,本文首先阐述农户信用评估的研究背景,并分别从现实和理论的角度说明进行农户信用评估研究的意义,接着对信用评估理论、农户信用、农户信用评估方法以及农户信用评估指标选取的相关文献进行梳理和阐述,为进一步研究夯实基础。其次,对机器学习相关... 

【文章来源】:安徽财经大学安徽省

【文章页数】:96 页

【学位级别】:硕士

【部分图文】:

基于机器学习的农户信用评估研究


技术路线图

函数图形,函数,算法,分类器


基于机器学习的农户信用评估研究15二、机器学习分类算法机器学习的分类算法种类繁多,根据分类器的多少可以分为单一学习分类算法和集成学习分类算法。单一学习分类算法是指模型只有一个分类器,常见的单一学习分类算法有KNN、Logistic回归、决策树等;集成学习分类算法是指将多个分类器进行组合,各个分类器可以相同也可以不同,目前相同的分类器居多,这些相同的分类器是由不同参数的同一分类器组成,即可以看成是一些相似的分类器,集成学习分类算法按照参与训练的基础学习器生成方式不同又可以分为串行学习器算法和并行学习器算法,常见的串行学习器算法有boosting系列算法下的AdaBoost、GBDT、XGBoost算法等,常见的并行学习器算法有bagging算法和RandomForest算法。由于篇幅限制,本文仅对本文实证分析中所使用的有关算法进行介绍,主要包括:(一)Logistic回归算法Logistic模型引入一个Logistic函数,将连续型的输出映射到区间(0,1)。在本文中,Y=1代表违约农户,Y=0代表正常农户。假定在本文的Logistic模型中有n个自变量,用向量组12(,,,)nXXX表示,Logistic模型经过机器学习会得出对应于自变量向量组的权值系数向量组12(,,,)n,通过该权值系数向量组和样本数据按照线性加权得到结果:1122nnYXXX(2.1)实际上,Logistic模型是一个基于条件概率的判别模型,这里引入sigmoid函数作为判别函数,sigmoid函数图形如图2-1所示,表达式为:1()1exX(2.2)图2-1sigmoid函数

过程图,算法,过程,森林


第二章机器学习相关理论18输入:训练集D,特征维度为d,随机选取特征数量m,决策树学习算法h。输出:集成模型H(x)。1:fort=1toTdo;2:使用Bootstrap抽样,从训练数据集D获得大小为n的抽样数据集tD;3:从d个特征中随机选取m个特征,基于tD中随机选取的m个特征,使用决策树模型学习得到一课决策树()thx;4:如果是回归问题,则输出集成模型:11()(())TttHxhxT;5:如果是分类问题,则输出集成模型:1()_({()})TttHxmajorityvotehx。由以上算法过程可知,随机森林之所以存在随机性,主要是因为:一方面随机森林采取Bootstrap抽样,这就保证了数据空间的随机性;另一方面特征及特征阈值的的随机选取保证了特征空间的随机性。若处理回归问题,利用平均值输出模型结果;若处理分类问题,随机森林中的每一个决策树都会预测新的样本所属类别,并将预测结果进行集中,称之为“投票”,选择票数最多的即为最后分类结果。随机森林的有点主要有:(1)由于建模时随机引入数据样本和样本特征,发生过拟合的可能性低,且抗噪声能力很强。(2)当很大一部分数据丢失时,随机森林能有效估计丢失值,并保持较高准确性。(3)能处理各种类型的数据集,图2-2RandomForest算法过程

【参考文献】:
期刊论文
[1]BP神经网络在农户信用评级领域的应用研究——以甘南藏族自治州为例[J]. 梁荣,严小军,布贵臣,冯华.  西部金融. 2019(11)
[2]农户品质对农户信用影响实证分析——基于“农分期”16101个农户贷款数据[J]. 李莉,张宗毅.  中国农业大学学报. 2019(01)
[3]基于ELECTRE III的农户小额贷款信用评级模型[J]. 石宝峰,王静.  系统管理学报. 2018(05)
[4]基于XGBoost的信用风险分析的研究[J]. 赵天傲,郑山红,李万龙,刘凯.  软件工程. 2018(06)
[5]基于MIC-MAC的农户信用评价指标体系优化研究[J]. 程鑫,石洪波,董媛香.  数学的实践与认识. 2018(08)
[6]交易费用对农户贷款资金规模影响的审查回归模型分析——基于湖北省某乡镇农户的调查[J]. 贺景霖.  湖北社会科学. 2017(12)
[7]一种创新型的农户信用评价方法——基于安徽省长丰县农村信用体系建设的实证研究[J]. 吴贻军,傅泳,许谦,胡瑶.  征信. 2017(07)
[8]基于GBDT与Logistic回归融合的个人信贷风险评估模型及实证分析[J]. 蔡文学,罗永豪,张冠湘,钟慧玲.  管理现代化. 2017(02)
[9]农业产业化龙头企业信用风险评价的改进——基于农村金融联结视角[J]. 李延敏,章敏.  农林经济管理学报. 2016(05)
[10]机器学习法在信贷风险预测识别中的应用[J]. 孙存一,王彩霞.  中国物价. 2015(12)

博士论文
[1]政府投资项目代建人信用评价体系与信用管理研究[D]. 陈文君.华北电力大学 2013
[2]我国个人征信体系的构建与应用研究[D]. 李俊丽.山东农业大学 2007
[3]机器学习与文本挖掘若干算法研究[D]. 何清.中国科学院研究生院(计算技术研究所) 2002

硕士论文
[1]甘肃省农村信用社农户信用评级体系改进研究[D]. 李增玉.兰州大学 2019
[2]基于违约损失显著判别的兼业型农户信用评价研究[D]. 董丹阳.西北农林科技大学 2019
[3]基于机器学习的信用评分模型研究[D]. 林一帆.天津商业大学 2019
[4]基于机器学习的信用评分模型研究[D]. 张杏枝.西南大学 2019
[5]随机森林优化算法在农户信用风险评估中的应用[D]. 宋鑫.云南师范大学 2018
[6]农户信用等级评价体系设计[D]. 徐宝石.西北农林科技大学 2017
[7]基于Logistic模型的呼和浩特市农户信用影响因素实证研究[D]. 郑黎阳.内蒙古农业大学 2016
[8]农户信用评价体系构建研究[D]. 王晓莹.云南财经大学 2016
[9]基于神经网络的农商行农户信用评级系统的设计与实现[D]. 伍伟.湖南大学 2015
[10]基于Logistic-SVM的农户信用评价组合模型研究[D]. 康艳红.吉林大学 2014



本文编号:3624771

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3624771.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c163***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com