船舶碰撞事故严重程度的预测模型研究
发布时间:2020-12-09 04:29
随着水运行业的迅速发展,水上交通安全越发受到重视。船舶碰撞事故作为水上交通事故中发生最频繁、造成损失最严重的事故类型之一,其发生往往会造成较为严重的后果。识别船舶碰撞事故严重程度的影响因素,构建船舶碰撞事故严重程度的预测模型,分析各个影响因素对于船舶碰撞事故严重程度的影响大小,能够为船公司完善管理制度、船舶驾驶员应急操纵和海事机构制定管理策略提供依据,具有重要的现实意义。本文通过对91份船舶碰撞事故调查报告的分析,首先提取出船舶碰撞事故严重程度的影响因素,建立了考虑不平衡数据的支持向量机多分类模型,模型对测试数据的预测精度较原始LIBSVM模型有较大的提升。其次使用GA-SVM-RFE算法对于影响因素进行了筛选,获取了影响因素的最优子集为感知阶段失误、被撞船舶种类、碰撞船舶吨位、被撞船舶吨位、被撞船舶船龄、船舶被撞部位、船舶会遇态势、碰撞船舶速度、昼夜因素、能见度10个因素,使用最优子集构建的支持向量机分类模型对于测试数据的预测精度可达90%。随后使用Ordered Probit分析最优子集中影响因素对船舶碰撞事故严重程度的影响大小,得出最优子集中的船舶被撞部位中的船首被撞、被撞船舶船...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
研究技术路线图
2.2.1 特征选择方法特征选择方法也可称为特征子集选择或者属性选择,是指从现有的特征之中选择出最优的特征子集,使构造的模型在分类准确度、预测精度及其他方面有着更为良好的表现。其主要思想是从特征集之中筛选出有用的、重要的、对于模型贡献度较大的特征属性,删除掉没用的或者不重要的特征。这些不重要的特征一般是指与分类关系较小、或者和其他特征有着相似的性能的冗余特征[43]。在船舶碰撞事故严重程度的影响因素选择中,其从初始的影响因素中选取出最优的特征子集,使得建立的分类模型对于测试数据的分类识别准确度最高。特征选择的过程一般是通过某种策略从原始特征集中选择出一个子集,使用适当的函数对于选出子集的构建的模型进行评估,与相应的停止标准进行对比,如果得到的特征子集能够满足停止标准,则停止特征选择,如未达到该标准,则继续进行下去,直至达到停止标准或者迭代次数得到最大后停止。筛选出最优特征子集之后再对其进行验证,验证该特征子集的有效性。
图 3-4 SVM-RFE 算法特征排序流程图公式中Q( i)表示为第i个特征被移除时所计算的Q的矩阵值。递将与分类器不相关或者相关性较小的特征先筛选,直至最后得到大的特征排序表,能够从有限样本中达到对大量样本分类的目的于处理样本数目少、空间维度高的问题,并优化了特征子集,提于 GA-SVM-RFE 的特征选择向量机递归消除算法每一次迭代消除模型中得分最小的影响因素素一个重要度排序,但是其忽略了影响因素之间的相互影响,在,被筛出的影响因素不会再加入到 SVM-RFE 算法流程中,如一类较强的影响因素在前期被筛选出,则难以获得最优的分类准确影响因素子集。因此为筛选出最优影响因素子集,应该使用启发对影响因素全集进行搜索,获取出使得模型评价最高的影响因素
本文编号:2906273
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
研究技术路线图
2.2.1 特征选择方法特征选择方法也可称为特征子集选择或者属性选择,是指从现有的特征之中选择出最优的特征子集,使构造的模型在分类准确度、预测精度及其他方面有着更为良好的表现。其主要思想是从特征集之中筛选出有用的、重要的、对于模型贡献度较大的特征属性,删除掉没用的或者不重要的特征。这些不重要的特征一般是指与分类关系较小、或者和其他特征有着相似的性能的冗余特征[43]。在船舶碰撞事故严重程度的影响因素选择中,其从初始的影响因素中选取出最优的特征子集,使得建立的分类模型对于测试数据的分类识别准确度最高。特征选择的过程一般是通过某种策略从原始特征集中选择出一个子集,使用适当的函数对于选出子集的构建的模型进行评估,与相应的停止标准进行对比,如果得到的特征子集能够满足停止标准,则停止特征选择,如未达到该标准,则继续进行下去,直至达到停止标准或者迭代次数得到最大后停止。筛选出最优特征子集之后再对其进行验证,验证该特征子集的有效性。
图 3-4 SVM-RFE 算法特征排序流程图公式中Q( i)表示为第i个特征被移除时所计算的Q的矩阵值。递将与分类器不相关或者相关性较小的特征先筛选,直至最后得到大的特征排序表,能够从有限样本中达到对大量样本分类的目的于处理样本数目少、空间维度高的问题,并优化了特征子集,提于 GA-SVM-RFE 的特征选择向量机递归消除算法每一次迭代消除模型中得分最小的影响因素素一个重要度排序,但是其忽略了影响因素之间的相互影响,在,被筛出的影响因素不会再加入到 SVM-RFE 算法流程中,如一类较强的影响因素在前期被筛选出,则难以获得最优的分类准确影响因素子集。因此为筛选出最优影响因素子集,应该使用启发对影响因素全集进行搜索,获取出使得模型评价最高的影响因素
本文编号:2906273
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/2906273.html