当前位置:主页 > 科技论文 > 交通工程论文 >

驾驶员事故频次分布及其影响因素分析

发布时间:2020-06-12 11:16
【摘要】:国内外道路交通安全形势严峻,人的因素是造成事故发生的一大重要原因。目前,交通事故的频次研究多是以“交通小区”、“行政区域”、“交叉口”等为单位来分析事故频次及影响因素,鲜有以驾驶员为单位对事故频次进行分析。据此,本文以发生负责任事故的小汽车驾驶员为研究对象,构建驾驶员事故频次的零膨胀计数模型,分析驾驶员事故频次的分布及其影响因素;基于SMOTE算法对非平衡数据进行处理,运用机器学习方法对驾驶员事故风险识别进行深入研究。研究结果可为利用历史违章数据对驾驶员进行事故预警提供科学依据。主要工作如下:(1)驾驶员事故频次分布规律。通过对原始事故数据进行清洗与融合处理,提取了 21560个驾驶员的有效样本,运用基本统计分析的方法,分析事故频次的总体分布规律及不同属性特征下的频次分布差异。结果表明性别、年龄、驾龄、车辆品牌、驾驶员前一年的违规次数和违规类型以及首次事故类型等特征变量均对驾驶员事故频次有显著性影响。(2)基于零膨胀模型的驾驶员事故频次关键影响因素分析。利用驾驶员的特征变量与其事故频次数据,构建驾驶员事故频次的零膨胀模型,揭示其事故频次的关键影响因子。模型结果表明,前一年有严重违规或首次事故为故意违法类型的驾驶员,其一年内再次发生负责任事故的可能性更高;驾龄短、驾校考核不严、前一年违章次数多的驾驶员,其发生事故的频次越高。(3)基于非平衡数据的驾驶员事故风险识别。基于SMOTE算法对事故频次的非平衡数据进行处理,运用Logistic模型、SVM分类算法及CART分类树等方法,得出特征变量的重要性排序,并识别驾驶员全年是否会发生多次事故。结果表明驾驶员前一年违规次数、违规类型、驾龄及年龄等变量重要度最高,由此论证了基于历史违章数据对驾驶员进行事故预警的合理性;识别效果方面,SVM方法最优,其准确率达79%。
【图文】:

驾驶员,年龄,个人属性,数值型


个人属性特征分布逡逑驶员个人属性特征主要包括性别、年龄以及驾龄等因素。不考虑事故各因素的分布情况如下:逡逑(1)性别逡逑21560个驾驶员样本中,,男性共计19318人,占总数的90%;女性共10%。逡逑(2)年龄逡逑先对年龄作为数值型变量进行特征分布分析,其范围处于18岁到70驾驶员样本的年龄集中于28岁到45岁这一青、中年段。驾驶员分布少。具体的不同年龄的驾驶员样本分布如图2-1所示。逡逑(3)驾龄逡逑同样将驾龄视为数值型变量进行特征分析,其范围处于0年到52界,驾龄在0年到20年的驾驶员数目较多,分布在驾龄大于20年。分布图如下2-1图所示。逡逑2000逡逑

扣分,驾驶员,总和,次数


共计7542个,占总数的34.98%;驾驶高档车驾驶员占比8少。逡逑历史违规特征分布逡逑1)违法次数逡逑法次数作为数值型变量,违规次数在0次的驾驶员数目最多,高达16次数在1次、2次等较多,分别为3436位、937位。具体分布如图2-2)违法类型逡逑重违法类型驾驶员共计5130位,占总驾驶员数目的76.2%;非严重总数的23.79%,共计16430位。逡逑3)扣分总和逡逑通事故驾驶员扣分情况与违规次数有所相似,扣分总和为0分的占比;其余扣分总和分布较为均匀。图2-2为驾驶员扣分总和分布。逡逑25000逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:U491.31

【相似文献】

相关期刊论文 前10条

1 叶枫;丁锋;;不平衡数据分类研究及其应用[J];计算机应用与软件;2018年01期

2 季梦遥;袁磊;;不平衡数据的随机平衡采样bagging算法分类研究[J];贵州大学学报(自然科学版);2017年06期

3 阴爱英;吴运兵;杨晓花;;面向制造业不平衡数据的混合采样算法[J];计算机工程与设计;2018年04期

4 金鑫;葛国青;陆旭;赵永彬;;不平衡数据分类预测的阈值优化算法ε-KSVM[J];计算机应用与软件;2018年01期

5 陈琼;徐洋洋;陈林清;;不平衡数据的迁移学习分类算法[J];华南理工大学学报(自然科学版);2018年01期

6 付俊杰;刘功申;;一种基于广义极值分布的非平衡数据分类算法[J];计算机研究与发展;2018年11期

7 徐婕;贺美美;;基于马氏抽样的SVM非平衡数据分类算法的泛化性能研究[J];电子学报;2018年11期

8 王进;游磊;黎忠文;苗放;;基于数据密度感知的非平衡数据模糊聚类方法[J];成都大学学报(自然科学版);2017年04期

9 魏正韬;杨有龙;白婧;;基于非平衡数据的随机森林分类算法改进[J];重庆大学学报;2018年04期

10 陈钟秀,沈新华,秦泽杭;环氧丙烷-苯乙酮二元体系的恒温汽液平衡研究[J];化学工程;2003年01期

相关硕士学位论文 前6条

1 王朋;基于Spark不平衡数据分类算法的研究[D];西安科技大学;2018年

2 石宁宁;驾驶员事故频次分布及其影响因素分析[D];北京交通大学;2018年

3 李金孟;基于Hubness的高维度不平衡数据分类算法[D];湖南大学;2017年

4 邱海波;非平衡数据分类算法在二手车推荐中的应用研究[D];南京航空航天大学;2016年

5 李慧;一种改进的随机森林并行分类方法在运营商大数据的应用[D];电子科技大学;2015年

6 李季;基于加权特征选择的误用入侵检测研究[D];哈尔滨工业大学;2010年



本文编号:2709453

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/2709453.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a33af***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com