基于集成学习的交通流量预测方法研究
发布时间:2021-08-06 13:06
现代城市区域中,交通状况通常会迅速变化,大部分城市中的道路基础设施和交通资源已临近饱和,无法通过增加基础设施缓解交通拥堵问题,日益增长的私家车保有量也在不断挑战交通系统的极限。使用智能交通系统发现交通流量的规律并预测交通流量,从而制定管理分流措施逐渐成为交通管理的新模式,智能交通系统的应用可以有效缓解交通拥堵,充分利用交通资源。随着科技的不断发展,智能交通系统通过传感器,行车装置收集交通数据,使得动态分析交通状态与预测交通流量变为可能。本文使用集成学习作为一种提高预测精确度的方法,构建并结合多个学习模型来完成学习任务,集成预测结果保证精度。由于数据中随机因素的影响,不同的学习模型会产生具有一定区别的预测结果,提出了一种基于极端梯度提升树与支持向量回归的堆叠集成预测模型,使用极端梯度提升树转换每个记录的输入,使用其预测结果形成的新特征,输入通过粒子群优化的支持向量回归模型进行再次学习,形成预测模型。在城市区域数据的相关实验证明这种回归与优化组成的集成预测方法是有效的。考虑交通流会受路网结构影响,存在空间相关性,提出了一种基于时空数据集成预测的交通流量预测方法,该方法使用随机森林和Ligh...
【文章来源】:北方工业大学北京市
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
集成学习模型
第二章相关工作研究6/202(()())(1)1exp(12)2TkTkkTPHxfxkT(2-2)P(H(x)f(x))代表集成模型的错误率,是基学习器的错误率,集成模型的分类错误率与基学习器数量呈指数下降。这种负相关关系的前提是基分类器之间相互独立,这在实际问题中是不现实的,所以如何平衡准确性与差异性是集成模型的最重要问题,集成学习通过几种不同的集成方式有效的找到了平衡点。2.1.2集成方式集成学习主要可以分为Bagging,Boosting,Stacking三大类别,旨在通过减少分类器的偏差和方差,平衡差异性来提高整体的准确性[27]。其中一些集合方法,例如Bagging中的随机森林(RandomForest,RF),仅用于减少方差,而其他集合方法,如增强Boosting,可以帮助减少偏差和方差。(1)BaggingBagging是起源最早的基本集成技术之一,是一种并行的集成学习方法,所有的基学习器不存在训练先后顺序,相互之间具有一定的独立性。Bagging可以描述为使用多个基学习器,分别对数据进行学习,最后结合得出结果,如果使用一样的学习算法作为基学习器,难以保证各基学习器之间的独立性,所以Bagging方法基于bootstrapping思想。图2-2基于bootstrapping思想的Bagging方法bootstrapping思想把训练集看做全体数据的子集,训练集对全体数据学习后的估计等价于用采样子集获得的数据来估计训练集。其主要特点为每个基学习器
第二章相关工作研究7采用有放回的随机抽样来获取训练数据,各个基学习器之间没有关联。Bagging的这种特点意味着可以彻底实现数据并行训练,提升效率。(2)BoostingBoosting方法是近些年广泛使用的梯度提升树GBDT[28]和AdaBoost[29]等模型使用的主要方法。Boosting方法是一种串行的思想,将基学习器不断提升,每一次构造新的基学习器会考虑上一个学习器的效果,形成强学习模型。图2-3Boosting方法以AdaBoost模型为例,该模型通过增加前一个基学习器错误预测样本的权值,使后一个基学习器对错误样本的关注度不断提升,从而尽可能纠正错误。AdaBoost的权值与样本分布与其使用的指数损失函数关联较强,如算法2-1所示:算法2-1AdaBoost算法伪代码输入:训练集D={(x1,y1),…,(xn,yn)}基学习器算法Ψ迭代次数T1()1/txn2fort1,2,,Tdo3,;tthD4~()()ttxtPhxfx5if0.5tbreak611ln2ttt71()exp,if()()()exp,if()()ttttttthfZhfxxxxxx()exp()()ttttfhZxxx8endfor输出:1()(())TtttHxsignahx
【参考文献】:
期刊论文
[1]基于分类决策树的城市内部迁居人群通勤时间预测模型[J]. 吴静娴,杨敏,韩印. 交通运输系统工程与信息. 2019(06)
[2]基于深度学习的短时交通流预测[J]. 罗向龙,焦琴琴,牛力瑶,孙壮文. 计算机应用研究. 2017(01)
[3]智能交通系统综述[J]. 赵娜,袁家斌,徐晗. 计算机科学. 2014(11)
[4]基于云遗传的RBF神经网络的交通流量预测[J]. 张琛,徐国丽. 计算机工程与应用. 2014(16)
[5]集成学习算法的研究与应用[J]. 侯勇,郑雪峰. 计算机工程与应用. 2012(34)
[6]An autoregressive integrated moving average model for short-term prediction of hepatitis C virus seropositivity among male volunteer blood donors in Karachi,Pakistan[J]. Saeed Akhtar,Shafquat Rozi. World Journal of Gastroenterology. 2009(13)
[7]智能交通系统研究回顾与展望[J]. 吴小强,李鹏,曲卫民. 国外公路. 2000(04)
本文编号:3325829
【文章来源】:北方工业大学北京市
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
集成学习模型
第二章相关工作研究6/202(()())(1)1exp(12)2TkTkkTPHxfxkT(2-2)P(H(x)f(x))代表集成模型的错误率,是基学习器的错误率,集成模型的分类错误率与基学习器数量呈指数下降。这种负相关关系的前提是基分类器之间相互独立,这在实际问题中是不现实的,所以如何平衡准确性与差异性是集成模型的最重要问题,集成学习通过几种不同的集成方式有效的找到了平衡点。2.1.2集成方式集成学习主要可以分为Bagging,Boosting,Stacking三大类别,旨在通过减少分类器的偏差和方差,平衡差异性来提高整体的准确性[27]。其中一些集合方法,例如Bagging中的随机森林(RandomForest,RF),仅用于减少方差,而其他集合方法,如增强Boosting,可以帮助减少偏差和方差。(1)BaggingBagging是起源最早的基本集成技术之一,是一种并行的集成学习方法,所有的基学习器不存在训练先后顺序,相互之间具有一定的独立性。Bagging可以描述为使用多个基学习器,分别对数据进行学习,最后结合得出结果,如果使用一样的学习算法作为基学习器,难以保证各基学习器之间的独立性,所以Bagging方法基于bootstrapping思想。图2-2基于bootstrapping思想的Bagging方法bootstrapping思想把训练集看做全体数据的子集,训练集对全体数据学习后的估计等价于用采样子集获得的数据来估计训练集。其主要特点为每个基学习器
第二章相关工作研究7采用有放回的随机抽样来获取训练数据,各个基学习器之间没有关联。Bagging的这种特点意味着可以彻底实现数据并行训练,提升效率。(2)BoostingBoosting方法是近些年广泛使用的梯度提升树GBDT[28]和AdaBoost[29]等模型使用的主要方法。Boosting方法是一种串行的思想,将基学习器不断提升,每一次构造新的基学习器会考虑上一个学习器的效果,形成强学习模型。图2-3Boosting方法以AdaBoost模型为例,该模型通过增加前一个基学习器错误预测样本的权值,使后一个基学习器对错误样本的关注度不断提升,从而尽可能纠正错误。AdaBoost的权值与样本分布与其使用的指数损失函数关联较强,如算法2-1所示:算法2-1AdaBoost算法伪代码输入:训练集D={(x1,y1),…,(xn,yn)}基学习器算法Ψ迭代次数T1()1/txn2fort1,2,,Tdo3,;tthD4~()()ttxtPhxfx5if0.5tbreak611ln2ttt71()exp,if()()()exp,if()()ttttttthfZhfxxxxxx()exp()()ttttfhZxxx8endfor输出:1()(())TtttHxsignahx
【参考文献】:
期刊论文
[1]基于分类决策树的城市内部迁居人群通勤时间预测模型[J]. 吴静娴,杨敏,韩印. 交通运输系统工程与信息. 2019(06)
[2]基于深度学习的短时交通流预测[J]. 罗向龙,焦琴琴,牛力瑶,孙壮文. 计算机应用研究. 2017(01)
[3]智能交通系统综述[J]. 赵娜,袁家斌,徐晗. 计算机科学. 2014(11)
[4]基于云遗传的RBF神经网络的交通流量预测[J]. 张琛,徐国丽. 计算机工程与应用. 2014(16)
[5]集成学习算法的研究与应用[J]. 侯勇,郑雪峰. 计算机工程与应用. 2012(34)
[6]An autoregressive integrated moving average model for short-term prediction of hepatitis C virus seropositivity among male volunteer blood donors in Karachi,Pakistan[J]. Saeed Akhtar,Shafquat Rozi. World Journal of Gastroenterology. 2009(13)
[7]智能交通系统研究回顾与展望[J]. 吴小强,李鹏,曲卫民. 国外公路. 2000(04)
本文编号:3325829
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3325829.html