当前位置:主页 > 经济论文 > 保险论文 >

基于机器学习的车险索赔频率预测

发布时间:2021-02-25 18:01
  近年来,广义线性模型已被广泛用于车险定价,而一些研究结果显示机器学习在某些方面优于广义线性模型,但这些结果都只是基于某个单一数据集。为了更全面地比较广义线性模型与机器学习方法在车险索赔频率预测问题上的效果,对7个车险数据集进行了比较测试,包括深度学习、随机森林、支持向量机、XGboost等机器学习方法;基于相同的训练集,建立不同的广义线性模型预测索赔频率,根据最小信息准则(AIC)选取最优的广义线性模型;通过交叉验证调参获得机器学习最佳参数和模型。研究结果显示:在所有的数据集上XGboost的预测效果一致地优于广义线性模型;对于某些自变量较多、变量间相关性强的数据集,神经网络、深度学习和随机森林的预测效果比广义线性模型更好。 

【文章来源】:统计与信息论坛. 2019,34(05)北大核心CSSCI

【文章页数】:10 页

【文章目录】:
一、引 言
二、模型介绍
    (一) 广义线性模型 (GLM)
    (二) 支持向量机 (SVM)
    (三) 随机森林 (Random Forest)
features) 。">        1.最大特征数 (maxfeatures) 。
estimators) 。">        2.子树的数量 (nestimators) 。
samplesleaf) 。">        3.叶子节点最少样本数 (minsamplesleaf) 。
    (四) 神经网络 (ANN) 和深度神经网络 (DNN) 模型
    (五) 梯度提升算法 (Gradient Boosting)
三、数据介绍
    (一) 数据集AutoClaim
    (二) 数据集Tangshan
    (三) 数据预处理
四、实证结果分析
    (一) 各种方法的最优模型和最优参数
    (二) 各种方法的比较分析
五、结 论
附录:有序Lorenz曲线和Gini系数及其计算方法。


【参考文献】:
期刊论文
[1]驾驶行为保险的风险预测模型研究[J]. 孟生旺,黄一凡.  保险研究. 2018(08)
[2]污染数据的稳健稀疏成组变量选择方法研究[J]. 李扬,许文甫,马双鸽.  统计与信息论坛. 2018(06)
[3]互联网环境下基于消费者搜索的酒店入住率预测研究[J]. 张斌儒,刘树林,张超锋,蒲玉莲.  统计与信息论坛. 2018(03)
[4]基于机器学习算法的车险索赔概率与累积赔款预测[J]. 孟生旺,李天博,高光远.  保险研究. 2017(10)



本文编号:3051349

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/bxjjlw/3051349.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7852d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com