当前位置:主页 > 法律论文 > 刑法论文 >

基于数据挖掘技术的汽车保险欺诈识别研究

发布时间:2024-06-11 05:53
  近年来,保险行业发展迅速,保险欺诈事件也逐渐增多,欺诈的普遍存在造成保险市场“高保费、高赔付、低收益”的运营现状,阻碍行业的可持续发展。因此,识别保险欺诈、防范控制风险、减少损失不仅能够促进保险公司经营健康发展,而且对促进经济发展、维护社会稳定都有着重要的现实意义。本文首先分析了现有汽车保险行业中保险欺诈的研究现状,对汽车保险欺诈的概念、分类、表现、危害等进行了系统概述。其次,针对现有研究的局限性及当前存在的问题,设计了一个基于数据挖掘技术的汽车保险欺诈识别系统。然后,从机动车保险欺诈识别的理论出发,分别基于极限学习机和随机森林建立了汽车保险欺诈识别模型。一方面,针对传统的极限学习机方差估计不稳健的问题,在稳健估计理论的基础上,提出了基于鲁棒估计的极限学习机模型,基于M估计的迭代加权最小二乘法对输出权重进行鲁棒估计。同时利用蜂群算法优化极限学习机的参数,进一步提高了极限学习机的分类性能和泛化能力,简化了模型的网络结构。另一方面,在平衡随机森林的基础上,提出了一种评价变量重要性的加权综合排序方法,将随机森林的特征重要性得分和基于统计t检验的特征重要性得分加权平均得到的综合得分作为启发式信...

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

图5.1网络权值矩阵和可视化网络拓扑图??Fig.?5.1?Network?weight?matrix?and?visual?network?topology??

图5.1网络权值矩阵和可视化网络拓扑图??Fig.?5.1?Network?weight?matrix?and?visual?network?topology??

函数采用交互熵,输出节点的激活函数为Sigmoid函数。共进行了?1507次迭代,??迭代结束时损失函数为64.74,权值的最大调整量为0.0087。由各网络节点的权??值,得网络权值矩阵和可视化网络拓扑图,如图5.1所示。??^——¥??囬?Un?\??[lf?1?15.266....


图5.2?广义权值散点图??Fig.?5.2?Gen?

图5.2?广义权值散点图??Fig.?5.2?Gen?

图5.2?广义权值散点图??Fig.?5.2?Generalized?weighted?scatter?plot??由图5.2,到期期限、驾驶员性别、定损照片张数和历史出险次数的广义权值??几乎均在0附近,所以这四个变量的重要性相对较弱;而车辆所属性质、是否??自动核保、验车情况....


图5.3数据集平衡化处理对分类准确度的影响??Fi.?5.3?The?influence?of?data?set?balance?on?classification?accurac

图5.3数据集平衡化处理对分类准确度的影响??Fi.?5.3?The?influence?of?data?set?balance?on?classification?accurac

对算法分类性能的影响。对文中的车险数据,随机选择产生训练集和测试??集,其中70%的数据构成训练集,剩余的数据作为测试集。通过计算分类准确率??和误差,对算法性能进行综合评价。10折交叉验证的测试结果如图5.3??和图5.4所示。??1001?■?'?????■?■?■?■—??....


图5.4数据集平衡化处理对06^误差的影响??

图5.4数据集平衡化处理对06^误差的影响??

图5.4数据集平衡化处理对06^误差的影响??Fig.?5.4?The?influence?of?data?set?balance?on?OOB?error??图5.3中,平衡后的数据集较初始非平衡数据集而言具有较高的分类准确??度。同时图5.4中平衡化数据集在005误差上性能的....



本文编号:3992506

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/xingfalunwen/3992506.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d186d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com