基于社交数据的个人信用评价研究
发布时间:2021-12-17 03:35
个人信用评价是互联网金融的重要组成部分,是交易双方正常往来的前提保证。随着大数据、人工智能、云计算、区块链等技术的发展,有关个人信用评价的研究也逐渐往新的方向发展并出现新的特征。传统的信用评价业务范围较小,在借贷历史、交易记录等金融数据缺失或不对称的情况下很难直接判断出一个人的真实信用,但利用大数据环境下的电商数据、社交数据以及网络上不经意的各种行为数据评估出的用户信用可以有效补充用户的信用信息。近几年,各大互联网公司、线上借贷平台以及信用依托产业如摩拜单车等都借助网络业务中的信息创建了个人信用评价模型来评定用户的信用,以此限制低信用用户的交易从而降低风险。诸如此类的互联网企业拥有海量的用户数据,在大数据征信的环境下占了优势地位,各自构建了适用自身业务的信用评价体系。然而一些大数据征信业务同样只从一个层面如线上交易数据评定用户的信用,为了避免传统信用评价过程中出现信用信息不足的情况,本文将从另一个角度来评估用户补充用户的信用情况,即通过社交数据进行个人信用评价。基于社交数据评价用户个人信用的研究过程中,以下三个问题有重大的研究意义:(1)由用户社交数据评估所得的社交信用只代表了用户信用...
【文章来源】:浙江财经大学浙江省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
技术路线图
第二节 行为模型及假设建立通过文献回顾,在以往学者研究的基础上可知社交数据在一定程度上可以评判一个人的信用,然而多数研究均是基于获取了用户在 P2P 平台或其他金融平台上的信用,将社交数据作为进一步评价用户信用或探究信用影响因素的辅助数据。本章节的主要目的便是区别于前人研究,通过实证方法从正面探讨社交因素是否会影响用户的信用。若是影响,则影响过程如何表现,最后证实社交数据可以用来评价用户的信用且信用评价结果与真实信用成正比。我们基于 ELM 理论框架构建行为模型并提出假设,找出信用评价过程的影响因素并验证其结果可行性。本文的行为模型框架如图 3-1 所示。中央路径主要通过用户社交关系来说明微博用户的可信度,而周边路径则通过社交身份质量体现用户的社交信用。这两个指标在涉及社交数据的文献中普遍存在。
N 表示用户总数。阳光信用的分类标准中,信用分在[300,600]区间的归类为信用差的用户,在[601,900]区间的归类为信用好的用户。参考芝麻信用官方的评价标准,我们将用户的芝麻信用分在区间[350,650]内的定义为信用差的用户,芝麻信用分大于 650 分的为信用好的用户。本文通过建立多个分类模型来验证阳光信用分预测用户信用的准确性,PCC 值越高,则模型的分类结果越好。我们将数据集分成 8:2 的比例,即 80%的数据用作训练集,20%的数据用作测试集。我们选择了 5 个分类模型来验证阳光信用分的分类准确率,包括 CART 决策树模型、支持向量机、神经网络、K 最近邻和贝叶斯模型。连城(2016)在其研究中指出,由于信用评价模型背后的构建理论与机理不同,对于同一组数据,不同的分类模型可以有不一样的表现效果。通过比较分类模型,不仅可以看到分类模型结果的差异,还可以直观地看到阳光信用分的分类率。本节中的结果均由 R 软件运行获得,PCC 的结果如下(参见图 3-2)。
本文编号:3539336
【文章来源】:浙江财经大学浙江省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
技术路线图
第二节 行为模型及假设建立通过文献回顾,在以往学者研究的基础上可知社交数据在一定程度上可以评判一个人的信用,然而多数研究均是基于获取了用户在 P2P 平台或其他金融平台上的信用,将社交数据作为进一步评价用户信用或探究信用影响因素的辅助数据。本章节的主要目的便是区别于前人研究,通过实证方法从正面探讨社交因素是否会影响用户的信用。若是影响,则影响过程如何表现,最后证实社交数据可以用来评价用户的信用且信用评价结果与真实信用成正比。我们基于 ELM 理论框架构建行为模型并提出假设,找出信用评价过程的影响因素并验证其结果可行性。本文的行为模型框架如图 3-1 所示。中央路径主要通过用户社交关系来说明微博用户的可信度,而周边路径则通过社交身份质量体现用户的社交信用。这两个指标在涉及社交数据的文献中普遍存在。
N 表示用户总数。阳光信用的分类标准中,信用分在[300,600]区间的归类为信用差的用户,在[601,900]区间的归类为信用好的用户。参考芝麻信用官方的评价标准,我们将用户的芝麻信用分在区间[350,650]内的定义为信用差的用户,芝麻信用分大于 650 分的为信用好的用户。本文通过建立多个分类模型来验证阳光信用分预测用户信用的准确性,PCC 值越高,则模型的分类结果越好。我们将数据集分成 8:2 的比例,即 80%的数据用作训练集,20%的数据用作测试集。我们选择了 5 个分类模型来验证阳光信用分的分类准确率,包括 CART 决策树模型、支持向量机、神经网络、K 最近邻和贝叶斯模型。连城(2016)在其研究中指出,由于信用评价模型背后的构建理论与机理不同,对于同一组数据,不同的分类模型可以有不一样的表现效果。通过比较分类模型,不仅可以看到分类模型结果的差异,还可以直观地看到阳光信用分的分类率。本节中的结果均由 R 软件运行获得,PCC 的结果如下(参见图 3-2)。
本文编号:3539336
本文链接:https://www.wllwen.com/falvlunwen/jinrfa/3539336.html