当前位置:主页 > 管理论文 > 统计学论文 >

迁移学习在现金贷违约预测中的应用研究

发布时间:2020-06-30 01:14
【摘要】:近年来,依托互联网金融科技的进步,“现金贷”这一新的金融产品发展迅猛。现金贷用户的违约预测变得越来越重要,但由于现金贷业务的新兴性及金融数据的敏感性,对于初创现金贷公司或拓展现金贷业务的公司来说,无法获取足够的有标签用户数据进行模型建立,为了解决风控平台的“冷启动”问题,同时拓展传统风控违约预测建模思路,本文结合“迁移学习”方法,利用某公司的信用贷数据和现金贷数据建立迁移学习预测模型,研究迁移学习在风控领域的应用的可行性。本文首先对目前风控领域的研究与应用进行了梳理,介绍了文中算法涉及的相关理论基础;之后针对实证数据的特点进行了简单的介绍,并进行预处理和特征工程,利用现金贷数据结合Logistic Regression算法和XGBoost算法建立传统模型并分析评估了模型效果;然后利用信用贷数据作为辅助数据,现金贷数据作为目标数据,分别使用Tradaboost迁移学习算法及基于XGBoost和K-means的迁移学习框架建立了预测模型并与传统模型进行对比,结果表明迁移学习算法可以在一定程度上提高模型预测能力,弥补样本不足情况下的模型预测能力较差的问题,同时,本文提出的基于XGBoost分类器的源域样本筛选方法效果较为显著。最后,本文结合模型效果及具体业务特点,提出了迁移学习模型在现金贷业务中应用的方式和方法。通过深入分析模型效果和具体业务,本文认为迁移学习方法针对无大量用户样本数据的冷启动情况有一定的帮助,迁移学习方法在现金贷风控平台的建设中具有一定的应用价值。
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C81
【图文】:

数据缺失,情况,缺失


上海师范大学硕士学位论文 数据介绍及特征工程金贷和信用贷数据集数据都有缺失情况,但缺失比不同,对于信用贷数据,大部分特征缺失比在 0.4 以下,而对于现金贷数据大部分缺失比在 0.63 以下。对于缺失较多的特征,后续我们需要进行剔除。表 3-3 数据特征变量名 类型 说明 示例 特征数量ProductInfo_X string 用户是否办理了产品 X 0 216Webinfo_X string 用户是否具有 X 的网络行为 1 3UserInfo_X string 用户特征 X 0 270Flag string 用户是否为违约用户 1 1

现金,用户特征


上海师范大学硕士学位论文 数据介绍及特征工程图 3-2 和图 3-3 分别为现金贷和信用贷部分用户特征的累计分布图,为了方便比较,这里首先对其数值进行了归一化处理,从分布图可以看出,两类样本的用户特征 82 的分布并不一致,但用户特征 242 分布基本一致。这也吻合两类业务用户的实际特点:即有一部分特征是相似的,而有部分特征是不同的。

【相似文献】

相关期刊论文 前10条

1 葛海燕;;学习群让数学课堂学习真正发生[J];江苏教育;2019年25期

2 李燕祥;;选对方法,快速适应高中数学学习[J];数学教学通讯;2019年18期

3 孙善云;;学生主体:小学数学核心素养落地的关键支撑[J];数学教学通讯;2019年16期

4 余建海;张明;;产教融合背景下的智慧学习探索与实践[J];课程教育研究;2019年28期

5 刘佳琴;;合作学习中如何处理好优生和学困生的关系[J];德阳教育学院学报;2003年04期

6 李莉萍;;合作学习实施中的问题及其对策探讨[J];西江教育论丛;2007年03期

7 吴甸起;;论新课改背景中的合作学习[J];青年教师;2007年03期

8 殷晓静;;基于资源的学习:信息化教育的一种重要模式[J];教育革新;2008年08期

9 张小东;;谈合作学习的误区及有效策略[J];青年教师;2005年02期

10 肖川;;学习的真义[J];青年教师;2016年08期

相关会议论文 前10条

1 阿勒尔黑;;浅析数学学习习惯的培养[A];2018年“基于核心素养的课堂教学改革”研讨会论文集[C];2018年

2 张平;王兰启;李晓敏;韦国友;和晓聪;;学生良好学习习惯的培养有效学习的研究[A];《教师教学能力发展研究》科研成果集(第十七卷)[C];2018年

3 祝青亮;洪艳;李乐桂;;小学数学合作学习的实践与研究[A];《教师教育能力建设研究》科研成果汇编(第九卷)[C];2018年

4 王娜;;孩子,课堂属于你们——学生是数学学习真正的主人[A];中国教育发展战略学会论文集卷四[C];2019年

5 杨华斌;;试论中学合作学习教学模式的运用研究[A];中国教育发展战略学会论文集卷四[C];2019年

6 温跃海;;小组合作学习有利于学生数学核心素养提升的研究[A];第十二届中国智慧工程研究会基础教育“十三五”规划课题会议论文集[C];2017年

7 刘扬威;;论学习兴趣的重要性[A];2019全国教育教学创新与发展高端论坛论文集(卷三)[C];2019年

8 ;多层次引领 让学习成为教师的习惯[A];河北省教师教育学会第九届优秀课题成果论坛文集[C];2018年

9 胡明标;;小学数学自主探究性学习的实施策略研究[A];《教师教学能力发展研究》科研成果集(第十一卷)[C];2017年

10 陆春庚;;学习型课堂构建刍议[A];《当代教育评论》2017第6辑[C];2017年

相关重要报纸文章 前10条

1 黄爱梅 桐城市范岗镇余桥小学教师;浅谈“学困生”的教育[N];江淮时报;2016年

2 实习生 邹春霞 本报记者 雷宇;中专生尹卫东:不要仅为成绩而学习[N];中国青年报;2012年

3 本报评论员;主题教育学习的关键 要往深里走往心里走往实里走[N];民主协商报;2019年

4 梁平;依靠学习走向未来[N];解放军报;2019年

5 本报记者 王频;打造浸润式“学习场”[N];江苏教育报;2019年

6 河南省洛阳市伊川县白元镇第一初级中学 张利浦;教师如何有效组织学生进行小组合作学习[N];山西青年报;2018年

7 记者 隋舒雨;学以致用 扎实推进“学习强国”学习平台工作[N];抚顺日报;2019年

8 广西壮族自治区钦州市人民警察训练学校副校长 龙玉平;大兴学习之风要力避“三舍”[N];人民公安报;2019年

9 上海市浦东教育发展研究院副研究员、学习共同体研究院院长 陈静静;通过观察学生促进深度学习[N];中国教师报;2019年

10 滨海县八滩镇中心小学 沈益亮;善用“错误”,促进有效学习[N];江苏教育报;2019年

相关博士学位论文 前10条

1 张正;基于结构和判别语义嵌入的图像表征学习研究[D];哈尔滨工业大学;2018年

2 范淼;基于表示学习的知识挖掘研究[D];清华大学;2017年

3 朱越;增广信息学习[D];南京大学;2018年

4 张文鹏;免投影在线学习[D];清华大学;2017年

5 翟中华;基于生成对抗网络的自监督表示学习研究及应用[D];浙江大学;2018年

6 李楠;顶序学习及其应用的研究[D];南京大学;2015年

7 孙维东;基于样本分布匹配的极化SAR数据迁移学习研究[D];武汉大学;2018年

8 李豪;多目标学习与优化理论及应用[D];西安电子科技大学;2018年

9 李志杰;面向大数据分析的多任务加速在线学习算法研究[D];武汉大学;2015年

10 魏晓聪;面向评论文本的迁移学习研究及应用[D];大连理工大学;2017年

相关硕士学位论文 前10条

1 马改丽;目标内容、自主支持对初中生学习投入的影响[D];内蒙古师范大学;2019年

2 卢柳衡;广西医科院校本科大学生学习倦怠现状与对策研究[D];广西医科大学;2018年

3 武晓鹏;中职生语文学习需求及对策研究[D];河北科技师范学院;2019年

4 赵瑾;地方高校大学生学业表现及提升对策研究[D];河北经贸大学;2019年

5 何流岩;小组工作介入中学生学习压力问题的实务探索[D];郑州大学;2019年

6 郑玲玲;初中生感恩倾向与学习投入的关系及其干预[D];内蒙古师范大学;2019年

7 郭娟;高一化学课堂小组合作学习的有效性研究[D];内蒙古师范大学;2019年

8 曹媛媛;在高中化学教学中促进学生深度学习的研究[D];内蒙古师范大学;2019年

9 其勒格尔;基于KST的学习诊断模型在《大学计算机基础》课程中的实践研究[D];内蒙古师范大学;2019年

10 张娟娟;基于微课的翻转课堂在高中数学学习中的实践研究[D];延安大学;2019年



本文编号:2734636

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2734636.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d4918***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com