当前位置:主页 > 科技论文 > 软件论文 >

基于移动电信数据的个人信用评估研究

发布时间:2025-03-30 00:25
  征信市场是社会主义市场经济体系不可分割的一部分,近年来,随着大数据技术的迅猛发展,我国的个人信用评估行业进入新的阶段。其中,基于移动电信数据进行个人信用的评估是目前研究的热点之一。为了更好的对维度众多的移动电信数据进行降维处理,本文研究了经典的特征选择算法ReliefF算法,并在其基础上基于kd-tree算法与互信息进行了优化,创造性地提出了IRfF(Improved ReliefF)算法。进一步地,本文对IRfF算法的性能进行了仿真检验。随后针对移动电信信用评估这一具体应用场景,参考FICO模型将实验数据集中的全部特征划分为6个维度。对实验数据集进行了数据清洗、数据离散化以及数据标准化处理并基于IRfF算法完成了特征选择。在此基础上,基于统计学方法分析各维度典型特征与用户信用的关系,基于K-means聚类方法进行探索性的数据挖掘。在完成对实验数据集的数据预处理以及特征降维处理后,本文进行了个人信用评估模型的搭建。在搭建过程中,借鉴了传统金融申请评分卡的相关思想,使用了逻辑回归、支持向量机、BP神经网络以及Xgboost算法从全维度特征以及各分维度特征分别建立机器学习模型,并比较各模型训...

【文章页数】:80 页

【学位级别】:硕士

【部分图文】:

图1一1近3年移动电话用户数变化趋?

图1一1近3年移动电话用户数变化趋?

终端数据?移动终端型号、终端档位、变更情况等??位置数据?移动电话的实时位置信息???账单数据用户每月的消费情况,如消费金额、消费的套餐种类等??话单数据?主叫号码、被叫号码、通话时长、起止时间等??通信数据?用户使用语音、短信、彩信业务的时长、次数等??上网数据|?用户使用移动....


图1-3?FICO评分的五个维度及其权重??除了这五个维度占有不同的权重外,每个维度内部不同的事件对评分的影响??

图1-3?FICO评分的五个维度及其权重??除了这五个维度占有不同的权重外,每个维度内部不同的事件对评分的影响??

表用户信用越好。进一步地,FICO的信用评估主要使用了用户五个维度的数据:??信用偿还历史(35%)、信用账户数(30%)、使用信用的年限(15%)、新开立的??信用账户(10%),正在使用的信用类型(10%),如图1-3所示。??正在使用的信用类型??10%?..偿还历史??信....


图1-4?ZestFinance信用评分換型??另外,ZestFinance的评分模型也会不断更新完善,包括更新个人信用评估??模型、增加新的数据源等

图1-4?ZestFinance信用评分換型??另外,ZestFinance的评分模型也会不断更新完善,包括更新个人信用评估??模型、增加新的数据源等

结合目前飞速发展的的大数据存储与处理技术,使用超过70000个特征变量,搭??建了?10多个机器学习子模型,在此基础上使用集成学习策略进行集成,最终得??到个人的信用评分,如图1-4所示??大数据??数据特征???I???FI?1F2?F3???F—70000???I???身份验....


图2-2IRfF流程图??2.4?IRfF算法仿真及性能分析??为了更加全面准确地检验IRfF算法的性能,本节基于python编程对其进行??

图2-2IRfF流程图??2.4?IRfF算法仿真及性能分析??为了更加全面准确地检验IRfF算法的性能,本节基于python编程对其进行??

冗余特征的缺陷,而原始ReliefF算法是IRfF算法的一个特殊情况(a?=?0),传??统的将特征冗余性计算与分类性能分开计算的改良方法同样是IRff算法的一个??特殊情况(a?=?〇〇),进一步地IRfF算法的流程如图2-2所示。????L.??r?\?/?\??幵始一?结束....



本文编号:4037889

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4037889.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户986fa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com