基于欠抽样面向不平衡数据集的交通事件自动检测方法
发布时间:2017-08-16 10:37
本文关键词:基于欠抽样面向不平衡数据集的交通事件自动检测方法
更多相关文章: 交通事件自动检测 邻域清理欠抽样 遗传算法 启发式选择抽样 支持向量机
【摘要】:随着经济的快速发展和小汽车保有量的急剧增长,道路交通供需矛盾日益尖锐,快速增长的交通需求使得交通事件频发、交通拥堵严重,导致交通环境不断恶化。准确及时的交通事件检测,能够有效缓解交通事件带来的交通拥堵,预防二次事故的发生,提高道路交通安全和服务水平。如何准确检测交通事件一直是智能交通领域的研究重点。现实中,交通事件的发生是偶然的,交通事件数据远远少于正常交通状态数据,交通事件检测实质是不平衡分类问题。因此,本文应用不平衡分类技术中的欠抽样方法解决交通事件检测问题,研究适应不平衡交通流数据的交通事件自动检测算法(Automatic Incident Detection, AID)。交通事件检测属于二分类问题,本文以支持向量机(Support Vector Machine, SVM)作为分类器,提出了三种基于不同欠抽样方法的交通事件检测模型。首先,将一种改进的非启发式欠抽样方法——邻域清理欠抽样方法,应用到交通事件检测中,提出基于邻域清理欠抽样的SVM AID模型。并采取网格搜索方法和粒子群算法进行SVM参数优化,选择性能更优的参数值作为模型的参数。其次,为了避免非启发式抽样算法人为设定样本抽样率的随机性缺陷,提出了基于遗传算法实例选择抽样的SVM AID模型,利用遗传算法“优胜劣汰”的寻优规则智能确定最佳学习样本集,并与非启发式抽样方法的应用效果进行对比分析。最后,考虑到学习样本集数据量较大时,模型学习及构建的长时耗问题,又提出了基于遗传算法支持向量选择抽样的SVM AID模型。利用SVM训练时起决定性作用的只是支持向量样本这一特性,仅针对比原始数据集小得多的支持向量集进行选择学习,并与前两种模型的检测性能进行对比分析。本文实验数据来源于新加坡AYE仿真数据库,实验算法以MATLAB R2011 b软件为平台编程实现。实验结果表明,本文提出的基于欠抽样的交通事件检测算法能有效改善面向不平衡数据集的交通事件检测效果,提高事件检测效率,获得较优的综合性能。
【关键词】:交通事件自动检测 邻域清理欠抽样 遗传算法 启发式选择抽样 支持向量机
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:U495
【目录】:
- 摘要5-6
- Abstract6-10
- 第一章 绪论10-16
- 1.1 研究背景及研究意义10-11
- 1.2 国内外研究综述11-14
- 1.2.1 交通事件自动检测算法11-12
- 1.2.2 不平衡分类技术12-13
- 1.2.2.1 数据层面方法12-13
- 1.2.2.2 算法层面方法13
- 1.2.3 研究现状分析13-14
- 1.3 论文主要研究内容14-15
- 1.4 本章小结15-16
- 第二章 交通事件检测原理及算法分析16-23
- 2.1 交通事件基本概念16
- 2.2 交通事件检测原理分析16-19
- 2.2.1 交通流特征参数16-17
- 2.2.2 交通事件对交通流特征参数的影响17-19
- 2.3 交通事件检测算法设计及评价指标分析19-22
- 2.3.1 面向不平衡数据集的AID算法设计19-20
- 2.3.2 AID算法评价指标20-22
- 2.4 本章小结22-23
- 第三章 基于邻域清理欠抽样的交通事件检测算法研究23-34
- 3.1 邻域清理欠抽样算法原理23
- 3.2 支持向量机原理及其分析23-26
- 3.2.1 最优分类面与广义最优分类面24-25
- 3.2.2 核函数25-26
- 3.3 基于邻域清理欠抽样的SVM AID算法流程26-27
- 3.4 实例验证27-32
- 3.4.1 实验数据27-28
- 3.4.1.1 数据描述27
- 3.4.1.2 SVM特征向量构建27-28
- 3.4.1.3 训练集与测试集构建28
- 3.4.2 SVM参数优化28-30
- 3.4.2.1 网格搜索方法优化SVM参数29
- 3.4.2.2 粒子群算法优化SVM参数29-30
- 3.4.3 实验结果分析30-32
- 3.5 本章小结32-34
- 第四章 基于GA-IS抽样的交通事件检测算法研究34-42
- 4.1 遗传算法的基本原理34-35
- 4.2 遗传算法实例选择(GA-IS)抽样的算法设计35-37
- 4.3 实例验证37-41
- 4.3.1 实验设计37-38
- 4.3.2 实验分析38-41
- 4.3.2.1 构建训练集与测试集38-39
- 4.3.2.2 GA-IS SVM AID模型检测效果分析39-40
- 4.3.2.3 与邻域清理欠抽样对比分析40-41
- 4.4 本章小结41-42
- 第五章 基于GA-SS抽样的交通事件检测算法研究42-50
- 5.1 支持向量在SVM分类中的作用机理42-44
- 5.1.1 支持向量的定义42-43
- 5.1.2 支持向量对SVM分类决策边界的影响43-44
- 5.2 遗传算法支持向量选择(GA-SS)抽样的算法设计44-46
- 5.3 实例验证46-49
- 5.3.1 性能评价指标47
- 5.3.2 实验结果分析47-49
- 5.4 本章小结49-50
- 第六章 总结与展望50-52
- 6.1 主要研究总结50
- 6.2 主要创新点50-51
- 6.3 研究展望51-52
- 致谢52-54
- 参考文献54-60
- 攻读硕士学位期间研究成果及参与项目60
【参考文献】
中国期刊全文数据库 前10条
1 邴其春;杨兆升;周熙阳;田秀娟;;基于因子分析和最小最大概率机的交通事件检测算法[J];交通信息与安全;2015年02期
2 刘擎超;陆建;陈淑燕;;基于随机森林的交通事件检测方法设计与分析(英文)[J];Journal of Southeast University(English Edition);2014年01期
3 汪云云;陈松灿;;基于AUC的分类器评价和设计综述[J];模式识别与人工智能;2011年01期
4 肖建;于龙;白裔峰;;支持向量回归中核函数和超参数选择方法综述[J];西南交通大学学报;2008年03期
5 裴瑞平;梁新荣;刘智勇;;基于小波变换和LS-SVM的事件检测算法[J];计算机工程与应用;2007年01期
6 梁新荣;刘智勇;孙德山;毛宗源;;基于支持向量机的高速公路事件检测[J];计算机工程与应用;2006年14期
7 祁亨年;支持向量机及其应用研究综述[J];计算机工程;2004年10期
8 张洋,叶东升,朱岩;高速公路交通事件检测系统研究[J];交通与计算机;2003年03期
9 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
10 邓卫,李峻利;高速公路常发性与偶发性交通拥挤的判别[J];东南大学学报;1994年02期
,本文编号:682828
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/682828.html