基于R的P2P网贷平台风险识别实证研究
发布时间:2021-04-27 06:07
近年来,互联网金融的兴起加快了整个金融市场的资金流动,各种新经济业态快速衍生,国内P2P行业的发展尤其迅速,P2P平台的数量每日都在增长,但伴随的问题与风险也逐步在提高,各种问题如携款跑路、资金提现困难、停业等层出不穷。投资者在进行投资时也面临了很大的风险,如何在投资时从各类P2P平台中识别出风险较高的平台,是政府以及投资者均面临的一大难题。本文旨在对P2P平台的风险进行识别,以便各投资者在投资决策过程中更加谨慎。本文主要通过模型比较找到一种分类性能最优的算法筛选出对P2P平台风险影响较大的最优指标组合,然后利用所选变量进行因子分析,计算出因子综合得分,利用综合得分对所选取的627家P2P平台进行评价排序,最终利用排名前后各50家P2P平台得分验证所建立的P2P平台风险评价体系的风险预测能力。在分析过程中本文主要借助R软件进行相关过程的分析,首先利用SVM算法、Boosting算法、随机森林算法、Bagging算法、CART算法、K近邻算法、二次判别分析模型共7种统计模型进行分类性能比较,通过10折交叉验证法划分训练集和测试集,分别计算7种模型的分类正确率,最终选择分类性能最优的随机森...
【文章来源】:成都理工大学四川省
【文章页数】:91 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 文献综述
1.2.1 国外研究综述
1.2.2 国内研究综述
1.3 研究方法与论文结构
1.3.1 研究方法
1.3.2 论文结构
1.4 创新点、难点与不足
1.4.1 创新之处
1.4.2 难点
1.4.3 不足之处
第2章 统计模型介绍
2.1 二次判别分析模型
2.2 树类模型
2.2.1 分类回归树算法(CART)
2.2.2 装袋法(Bagging)
2.2.3 提升法(Boosting)
2.2.4 随机森林(Random Forest)
2.3 支持向量机(SVM)
2.4 K最近邻分类算法(KNN)
第3章 样本及变量选取
3.1 数据及样本获取
3.1.1 数据获取路径说明
3.1.2 样本初步选取
3.2 变量的选取
3.2.1 P2P网贷平台基本信息
3.2.2 P2P网贷平台交易信息
3.2.3 P2P网贷平台外部信息
第4章 数据处理及基本分析
4.1 数据获取
4.1.1 交易信息数据处理
4.1.2 外部信息数据处理
4.2 数据预处理
4.2.1 缺失值处理
4.2.2 异常值处理
4.2.3 数据标准化处理
4.3 描述性统计分析
第5章 P2P平台风险识别实证分析
5.1 统计模型预测结果的比较分析
5.1.1 平衡样本
5.1.2 训练集与测试集划分
5.1.3 分类模型混淆矩阵评价
5.1.4 分类模型其他评价方法
5.1.5 分类模型比较结果
5.2 P2P平台风险识别指标筛选
5.2.1 特征选择的基本原理
5.2.2 基于AUC-RF的指标筛选
5.2.3 随机森林分类误差分析
5.2.4 变量重要性分析
5.3 P2P网贷平台风险特征分析
第6章 P2P平台风险综合评价
6.1 P2P网贷平台风险综合评价
6.1.1 构建P2P平台风险综合评价指标体系
6.1.2 因子分析
6.2 P2P平台风险综合评价结果分析
结论
致谢
参考文献
攻读学位期间取得学术成果
【参考文献】:
期刊论文
[1]基于随机森林模型的中国居民出境旅游影响因素重要性研究[J]. 张丽峰. 资源开发与市场. 2017(06)
[2]对P2P网贷风险及相关舆情风险的研究——基于大数据就网民相应情绪所做的分析[J]. 丁晓蔚,高淑萍. 当代传播. 2017(02)
[3]新经济业态P2P网络借贷的风险甄别研究[J]. 范超,王磊,解明明. 统计研究. 2017(02)
[4]基于AHP的P2P网贷平台风险实证分析[J]. 蔡友莉. 现代商贸工业. 2017(04)
[5]机器学习算法在P2P网贷平台风险评级中的应用[J]. 张蜀林,李萌萌. 时代金融. 2017(03)
[6]从P2P网贷舆情风险看媒体舆论引导作用[J]. 丁晓蔚. 中国出版. 2016(24)
[7]我国P2P网贷平台风险评估实证研究[J]. 单鹏,杨佳琳,邓颖璐. 中国物价. 2016(11)
[8]基于互联网金融的P2P网贷市场SWOT分析[J]. 梁莹莹. 对外经贸. 2016(10)
[9]基于改进四分图模型的P2P网贷平台竞争力诊断研究[J]. 许楠,曹齐芳. 金融发展研究. 2016(10)
[10]P2P网贷平台与投资人之间信息不对称问题的研究[J]. 王丽. 物流工程与管理. 2016(10)
硕士论文
[1]p2p借款人信用风险研究[D]. 陈丽.华东政法大学 2016
[2]互联网金融的风险识别及控制研究[D]. 张慧.山东大学 2015
[3]P2P平台风险评价及控制研究[D]. 唐嘉悦.青岛理工大学 2015
[4]中国P2P网络借贷信用风险研究[D]. 冯泽敏.辽宁大学 2015
[5]P2P网络借贷市场的融资成本与融资可获得性研究[D]. 郭弈.西南财经大学 2011
本文编号:3162921
【文章来源】:成都理工大学四川省
【文章页数】:91 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 文献综述
1.2.1 国外研究综述
1.2.2 国内研究综述
1.3 研究方法与论文结构
1.3.1 研究方法
1.3.2 论文结构
1.4 创新点、难点与不足
1.4.1 创新之处
1.4.2 难点
1.4.3 不足之处
第2章 统计模型介绍
2.1 二次判别分析模型
2.2 树类模型
2.2.1 分类回归树算法(CART)
2.2.2 装袋法(Bagging)
2.2.3 提升法(Boosting)
2.2.4 随机森林(Random Forest)
2.3 支持向量机(SVM)
2.4 K最近邻分类算法(KNN)
第3章 样本及变量选取
3.1 数据及样本获取
3.1.1 数据获取路径说明
3.1.2 样本初步选取
3.2 变量的选取
3.2.1 P2P网贷平台基本信息
3.2.2 P2P网贷平台交易信息
3.2.3 P2P网贷平台外部信息
第4章 数据处理及基本分析
4.1 数据获取
4.1.1 交易信息数据处理
4.1.2 外部信息数据处理
4.2 数据预处理
4.2.1 缺失值处理
4.2.2 异常值处理
4.2.3 数据标准化处理
4.3 描述性统计分析
第5章 P2P平台风险识别实证分析
5.1 统计模型预测结果的比较分析
5.1.1 平衡样本
5.1.2 训练集与测试集划分
5.1.3 分类模型混淆矩阵评价
5.1.4 分类模型其他评价方法
5.1.5 分类模型比较结果
5.2 P2P平台风险识别指标筛选
5.2.1 特征选择的基本原理
5.2.2 基于AUC-RF的指标筛选
5.2.3 随机森林分类误差分析
5.2.4 变量重要性分析
5.3 P2P网贷平台风险特征分析
第6章 P2P平台风险综合评价
6.1 P2P网贷平台风险综合评价
6.1.1 构建P2P平台风险综合评价指标体系
6.1.2 因子分析
6.2 P2P平台风险综合评价结果分析
结论
致谢
参考文献
攻读学位期间取得学术成果
【参考文献】:
期刊论文
[1]基于随机森林模型的中国居民出境旅游影响因素重要性研究[J]. 张丽峰. 资源开发与市场. 2017(06)
[2]对P2P网贷风险及相关舆情风险的研究——基于大数据就网民相应情绪所做的分析[J]. 丁晓蔚,高淑萍. 当代传播. 2017(02)
[3]新经济业态P2P网络借贷的风险甄别研究[J]. 范超,王磊,解明明. 统计研究. 2017(02)
[4]基于AHP的P2P网贷平台风险实证分析[J]. 蔡友莉. 现代商贸工业. 2017(04)
[5]机器学习算法在P2P网贷平台风险评级中的应用[J]. 张蜀林,李萌萌. 时代金融. 2017(03)
[6]从P2P网贷舆情风险看媒体舆论引导作用[J]. 丁晓蔚. 中国出版. 2016(24)
[7]我国P2P网贷平台风险评估实证研究[J]. 单鹏,杨佳琳,邓颖璐. 中国物价. 2016(11)
[8]基于互联网金融的P2P网贷市场SWOT分析[J]. 梁莹莹. 对外经贸. 2016(10)
[9]基于改进四分图模型的P2P网贷平台竞争力诊断研究[J]. 许楠,曹齐芳. 金融发展研究. 2016(10)
[10]P2P网贷平台与投资人之间信息不对称问题的研究[J]. 王丽. 物流工程与管理. 2016(10)
硕士论文
[1]p2p借款人信用风险研究[D]. 陈丽.华东政法大学 2016
[2]互联网金融的风险识别及控制研究[D]. 张慧.山东大学 2015
[3]P2P平台风险评价及控制研究[D]. 唐嘉悦.青岛理工大学 2015
[4]中国P2P网络借贷信用风险研究[D]. 冯泽敏.辽宁大学 2015
[5]P2P网络借贷市场的融资成本与融资可获得性研究[D]. 郭弈.西南财经大学 2011
本文编号:3162921
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3162921.html