基于知识图谱的风控模型的研究与实现
发布时间:2023-02-01 11:30
人类的活动可能总是伴随着风险的发生,风险是一种违背人意愿的行为事件。而风险在人类文明诞生的伊始,就受到了关注。公元前两千年,汉谟拉比法典就有关于火灾保险和货物运输保险的记载。风险管控领域涉及方方面面,对于人们最熟悉的金融机构来说,面临着包括个人信用风险、市场金融风险、流动性风险等。其中信用风险是最为显著的,信用风险主要是指,借款人在与出借人约定的还款日期到期后,却没能按照协议完成还款行为,导致出借人或者相应的金融机构财产损失的风险。这种违约行为无论是出自主观上的不愿意或者出自客观上的经济受限,都与借款人有着一定的联系。本文以P2P网络贷款为研究背景,从借贷样本分析客户,构建完整的风控模型,并建立风控平台。主要工作包括:(1)基于国外搜索引擎公司开发的schema网页标记语言模型去构筑客户的知识图谱数据,该数据模型中包含有一整套类型集合,以多层次的继承结构进行组织。用半结构化数据格式JSO N-LD表述知识图谱信息,将客户信息有机地组织起来,解决数据孤岛问题。(2)样本数据为不平衡数据,即正常样本远远多于违约样本,如果直接使用这种数据集进行分类,会对算法的学习过程造成干扰。而传统的欠采样...
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 课题研究背景及意义
1.1.1 风险研究背景
1.1.2 P2P网贷平台背景
1.2 国内外研究现状
1.2.1 国内外风控模型的研究现状
1.2.2 国内外P2P网贷风控模型的研究现状
1.3 论文的研究内容
1.4 论文组织结构
第二章 知识图谱
2.1 知识图谱概述
2.2 知识图谱的定义与结构
2.2.1 知识图谱的定义
2.2.2 知识图谱的结构
2.3 基于schema.org构建P2P网贷客户知识图谱
2.3.1 schema.org
2.3.2 P2P网贷客户知识图谱
2.4 本章小结
第三章 不平衡数据集的处理
3.1 数据集介绍
3.2 不平衡数据集
3.2.1 不平衡数据集在分类任务中的缺陷
3.2.2 处理不平衡数据集问题的相关技术
3.3 CBNM算法设计
3.4 实验结果
3.4.1 评价标准
3.4.2 数据集
3.4.3 实验结果与分析
3.5 本章总结
第四章 结合标签规则的风控模型
4.1 标签模型
4.1.1 定量分析
4.1.2 监督学习
4.1.3 聚类判别
4.1.4 标签预测
4.2 特征筛选
4.3 实验对比
4.3.1 实验所用的分类算法
4.3.2 实验结果
4.4 本章总结
第五章 风控平台的实现
5.1 平台框架
5.2 Elastic Search
5.3 平台功能实现
5.3.1 属性字典和属性数据元功能实现关键
5.3.2 实体维护功能实现关键
5.3.3 数据检索功能实现关键
5.4 平台设计以及运行实例
5.4.1 知识图谱
5.4.2 数据检索
5.5 本章总结
第六章 总结与展望
6.1 总结
6.2 进一步工作的展望
参考文献
致谢
在学期间的研究成果以及发表的学术论文
【参考文献】:
期刊论文
[1]特征降维技术的研究与进展[J]. 黄铉. 计算机科学. 2018(S1)
[2]基于机器学习的P2P网络借贷违约风险预警研究——来自“拍拍贷”的借贷交易证据[J]. 涂艳,王翔宇. 统计与信息论坛. 2018(06)
[3]融入软信息的P2P网络借贷违约预测方法[J]. 蒋翠清,王睿雅,丁勇. 中国管理科学. 2017(11)
[4]k-means和逻辑回归混合策略的不平衡类学习方法[J]. 邬长安,郑桂荣,孙艳歌,郭华平. 小型微型计算机系统. 2017(09)
[5]一种改进的CHI文本特征选择方法[J]. 樊存佳,汪友生,王雨婷. 计算机与现代化. 2016(11)
[6]基于样本权重的不平衡数据欠抽样方法[J]. 熊冰妍,王国胤,邓维斌. 计算机研究与发展. 2016(11)
[7]基于单分类支持向量机和主动学习的网络异常检测研究[J]. 刘敬,谷利泽,钮心忻,杨义先. 通信学报. 2015(11)
[8]基于数据密度分布的欠采样方法研究[J]. 杨杰明,闫欣,曲朝阳,宋晨晨,乔媛媛. 计算机应用研究. 2016(10)
[9]Eco-environmental vulnerability assessment for large drinking water resource: a case study of Qiandao Lake Area,China[J]. Qing GU,Jun LI,Jinsong DENG,Yi LIN,Ligang MA,Chaofan WU,Ke WANG,Yang HONG. Frontiers of Earth Science. 2015(03)
[10]基于布谷鸟算法和支持向量机的变压器故障诊断[J]. 薛浩然,张珂珩,李斌,彭晨辉. 电力系统保护与控制. 2015(08)
博士论文
[1]中小商业银行信用风险评价研究[D]. 吕品.大连理工大学 2014
硕士论文
[1]基于机器学习技术的P2P风控模型研究[D]. 王梦雪.哈尔滨工业大学 2017
[2]基于支持向量机的蔬菜质量安全预测及溯源模型的研究与应用[D]. 曹秋勤.华南理工大学 2014
[3]我国互联网金融征信体系建设研究[D]. 杜晓峰.厦门大学 2014
本文编号:3734141
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 课题研究背景及意义
1.1.1 风险研究背景
1.1.2 P2P网贷平台背景
1.2 国内外研究现状
1.2.1 国内外风控模型的研究现状
1.2.2 国内外P2P网贷风控模型的研究现状
1.3 论文的研究内容
1.4 论文组织结构
第二章 知识图谱
2.1 知识图谱概述
2.2 知识图谱的定义与结构
2.2.1 知识图谱的定义
2.2.2 知识图谱的结构
2.3 基于schema.org构建P2P网贷客户知识图谱
2.3.1 schema.org
2.3.2 P2P网贷客户知识图谱
2.4 本章小结
第三章 不平衡数据集的处理
3.1 数据集介绍
3.2 不平衡数据集
3.2.1 不平衡数据集在分类任务中的缺陷
3.2.2 处理不平衡数据集问题的相关技术
3.3 CBNM算法设计
3.4 实验结果
3.4.1 评价标准
3.4.2 数据集
3.4.3 实验结果与分析
3.5 本章总结
第四章 结合标签规则的风控模型
4.1 标签模型
4.1.1 定量分析
4.1.2 监督学习
4.1.3 聚类判别
4.1.4 标签预测
4.2 特征筛选
4.3 实验对比
4.3.1 实验所用的分类算法
4.3.2 实验结果
4.4 本章总结
第五章 风控平台的实现
5.1 平台框架
5.2 Elastic Search
5.3 平台功能实现
5.3.1 属性字典和属性数据元功能实现关键
5.3.2 实体维护功能实现关键
5.3.3 数据检索功能实现关键
5.4 平台设计以及运行实例
5.4.1 知识图谱
5.4.2 数据检索
5.5 本章总结
第六章 总结与展望
6.1 总结
6.2 进一步工作的展望
参考文献
致谢
在学期间的研究成果以及发表的学术论文
【参考文献】:
期刊论文
[1]特征降维技术的研究与进展[J]. 黄铉. 计算机科学. 2018(S1)
[2]基于机器学习的P2P网络借贷违约风险预警研究——来自“拍拍贷”的借贷交易证据[J]. 涂艳,王翔宇. 统计与信息论坛. 2018(06)
[3]融入软信息的P2P网络借贷违约预测方法[J]. 蒋翠清,王睿雅,丁勇. 中国管理科学. 2017(11)
[4]k-means和逻辑回归混合策略的不平衡类学习方法[J]. 邬长安,郑桂荣,孙艳歌,郭华平. 小型微型计算机系统. 2017(09)
[5]一种改进的CHI文本特征选择方法[J]. 樊存佳,汪友生,王雨婷. 计算机与现代化. 2016(11)
[6]基于样本权重的不平衡数据欠抽样方法[J]. 熊冰妍,王国胤,邓维斌. 计算机研究与发展. 2016(11)
[7]基于单分类支持向量机和主动学习的网络异常检测研究[J]. 刘敬,谷利泽,钮心忻,杨义先. 通信学报. 2015(11)
[8]基于数据密度分布的欠采样方法研究[J]. 杨杰明,闫欣,曲朝阳,宋晨晨,乔媛媛. 计算机应用研究. 2016(10)
[9]Eco-environmental vulnerability assessment for large drinking water resource: a case study of Qiandao Lake Area,China[J]. Qing GU,Jun LI,Jinsong DENG,Yi LIN,Ligang MA,Chaofan WU,Ke WANG,Yang HONG. Frontiers of Earth Science. 2015(03)
[10]基于布谷鸟算法和支持向量机的变压器故障诊断[J]. 薛浩然,张珂珩,李斌,彭晨辉. 电力系统保护与控制. 2015(08)
博士论文
[1]中小商业银行信用风险评价研究[D]. 吕品.大连理工大学 2014
硕士论文
[1]基于机器学习技术的P2P风控模型研究[D]. 王梦雪.哈尔滨工业大学 2017
[2]基于支持向量机的蔬菜质量安全预测及溯源模型的研究与应用[D]. 曹秋勤.华南理工大学 2014
[3]我国互联网金融征信体系建设研究[D]. 杜晓峰.厦门大学 2014
本文编号:3734141
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3734141.html