基于决策树的居民出行方式选择影响因素研究
发布时间:2021-03-25 04:10
随着中国经济的快速发展,城市居民交通出行问题成为公众关注的焦点。根据居民出行调查数据分析、总结居民的出行行为是城市交通规划建设中不可或缺的工作,也可为相关部门制定交通管理政策提供参考依据。目前,国内外关于居民出行行为的研究主要基于非集计模型展开,而应用数据挖掘等技术进行居民出行行为分析的研究较少。因此,本文提出运用决策树的方法对居民出行数据进行深度挖掘,以分析影响城市居民出行行为的关键影响因素和作用机理。本文首先对居民出行方式影响因素进行了研究,然后对常用居民出行方式选择行为分析模型进行了理论对比,探索从数据挖掘的角度,利用决策树模型以出行和简单出行链为研究对象对居民出行数据进行分析。在对比决策树模型的基础上,选择有代表性的Exhaustive CHAID模型和C5.0的模型进行了居民出行影响因素模型构建。同时对模型进行了参数优化,比如设定了基于“绿色出行”的成本矩阵等。通过基于出行和基于出行链的居民出行方式选择影响因素对比分析表明:(1)二者总体影响因素相近,作用规律类似。小汽车拥有量、职业、出行时间等是影响居民出行选择的关键因素。同时也挖掘出该市居民由步行出行方式向其他方式转移的时...
【文章来源】:大连交通大学辽宁省
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图3.1简单结构方程模型??Fig.?3.1?Simple?structural?equation?model??基于结构方程的出行行为的研宄,主要是利用结构方程模型,以个人、家庭的社会??
?第三章居民出行方式选择影响因素的模型构建???拥有小??^?\W??小汽车出行?行时??,XX?,??小于40分钟?|大于40分钟|??XX??步行出行I?I公交出行??图3.2决策树示意图??Fig.?3.2?Diagram?of?the?decision?tree??自上而下的递归是决策树的构造方法,是“分而治之”的过程。其使用的贪婪模型??是自顶向下的,如图3.3决策树生长过程所示,在每个结点选择分类效果最佳的决策属??性,然后对样本集进行划分,递归的执行这一操作[411,直到这棵树能够准确地分类样本??集为止。如何选择出分类效果最佳的决策属性,是决策树方法最重要的问题,常见的决??策属性有:信息增益及其改进增益率、基尼系数、卡方检验等。使用信息增益的模型有??ID3,使用增益率的模型有C4.5,使用基尼系数的模型有CART,使用卡方检验的模型??有CHAID。在实验中,如果决策树树形过于复杂,会导致决策树是难以理解的,同时??对应的决策树的分类规则就出现冗余,将导致应用效果不佳。同时样本集中有可能存在??着异常数据,会导致一些异常分支的产生,这些都需要我们对生成的决策树模型进行剪??枝处理。??①预剪枝??在模型应用之前,指定某一相关阈值,一旦达到指定阈值,树的生长就会停止。预??剪枝方法因为相对简单,效率也很高,因此适合于解决大规模问题,但是这种方法的缺??点是不容易确定相应的阈值[42]。因此,大部分学者们会以分类正确率作为阈值进行预剪??枝控制,通过随阈值变化决定树的复杂度。??17??
?大连交通大学全日制专业硕士学位论文???确定根节点分支准则??长出一层枝??是?????在某枝中重新确定分??支准则???差异下降显著??否??????达到叶节点??是???I???决策树生长完成??图3.3决策树生长过程??Fig.?3.3?Decision?tree?growth?process??②后剪枝??后剪枝技术是指在形成的决策树的基础上,剪除不具备代表性的子树,生成叶节点,??从而形成小规模的新树。C4.5、CART等主要采用后剪枝技术。后剪枝操作同时会边修??剪边检验。??18??
【参考文献】:
硕士论文
[1]基于数据挖掘技术的2型糖尿病患病风险预测研究[D]. 朱亚楠.燕山大学 2017
[2]基于出行模式和神经网络的地铁短时客流预测方法研究[D]. 杨磊.吉林大学 2017
[3]特大城市居民出行方式选择行为特性研究[D]. 栾鑫.东南大学 2016
[4]基于出行链的通道交通方式选择模型研究[D]. 郑晓静.长安大学 2016
[5]城市居民晚间出行决策研究[D]. 黄欣然.长安大学 2016
[6]轨道交通延伸线区域居民出行方式选择行为研究[D]. 毛立人.西南交通大学 2015
[7]城市轨道交通新线开通对居民出行方式选择的影响研究[D]. 刘明然.北京交通大学 2015
[8]基于出行者特性的出行行为研究[D]. 徐奥林.北京交通大学 2014
[9]基于离散选择模型的城市轨道交通站点慢行交通吸引特性研究[D]. 赵鑫.兰州交通大学 2014
[10]数据挖掘在计算机等级考试管理中的应用研究[D]. 郑秀月.福州大学 2014
本文编号:3098998
【文章来源】:大连交通大学辽宁省
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图3.1简单结构方程模型??Fig.?3.1?Simple?structural?equation?model??基于结构方程的出行行为的研宄,主要是利用结构方程模型,以个人、家庭的社会??
?第三章居民出行方式选择影响因素的模型构建???拥有小??^?\W??小汽车出行?行时??,XX?,??小于40分钟?|大于40分钟|??XX??步行出行I?I公交出行??图3.2决策树示意图??Fig.?3.2?Diagram?of?the?decision?tree??自上而下的递归是决策树的构造方法,是“分而治之”的过程。其使用的贪婪模型??是自顶向下的,如图3.3决策树生长过程所示,在每个结点选择分类效果最佳的决策属??性,然后对样本集进行划分,递归的执行这一操作[411,直到这棵树能够准确地分类样本??集为止。如何选择出分类效果最佳的决策属性,是决策树方法最重要的问题,常见的决??策属性有:信息增益及其改进增益率、基尼系数、卡方检验等。使用信息增益的模型有??ID3,使用增益率的模型有C4.5,使用基尼系数的模型有CART,使用卡方检验的模型??有CHAID。在实验中,如果决策树树形过于复杂,会导致决策树是难以理解的,同时??对应的决策树的分类规则就出现冗余,将导致应用效果不佳。同时样本集中有可能存在??着异常数据,会导致一些异常分支的产生,这些都需要我们对生成的决策树模型进行剪??枝处理。??①预剪枝??在模型应用之前,指定某一相关阈值,一旦达到指定阈值,树的生长就会停止。预??剪枝方法因为相对简单,效率也很高,因此适合于解决大规模问题,但是这种方法的缺??点是不容易确定相应的阈值[42]。因此,大部分学者们会以分类正确率作为阈值进行预剪??枝控制,通过随阈值变化决定树的复杂度。??17??
?大连交通大学全日制专业硕士学位论文???确定根节点分支准则??长出一层枝??是?????在某枝中重新确定分??支准则???差异下降显著??否??????达到叶节点??是???I???决策树生长完成??图3.3决策树生长过程??Fig.?3.3?Decision?tree?growth?process??②后剪枝??后剪枝技术是指在形成的决策树的基础上,剪除不具备代表性的子树,生成叶节点,??从而形成小规模的新树。C4.5、CART等主要采用后剪枝技术。后剪枝操作同时会边修??剪边检验。??18??
【参考文献】:
硕士论文
[1]基于数据挖掘技术的2型糖尿病患病风险预测研究[D]. 朱亚楠.燕山大学 2017
[2]基于出行模式和神经网络的地铁短时客流预测方法研究[D]. 杨磊.吉林大学 2017
[3]特大城市居民出行方式选择行为特性研究[D]. 栾鑫.东南大学 2016
[4]基于出行链的通道交通方式选择模型研究[D]. 郑晓静.长安大学 2016
[5]城市居民晚间出行决策研究[D]. 黄欣然.长安大学 2016
[6]轨道交通延伸线区域居民出行方式选择行为研究[D]. 毛立人.西南交通大学 2015
[7]城市轨道交通新线开通对居民出行方式选择的影响研究[D]. 刘明然.北京交通大学 2015
[8]基于出行者特性的出行行为研究[D]. 徐奥林.北京交通大学 2014
[9]基于离散选择模型的城市轨道交通站点慢行交通吸引特性研究[D]. 赵鑫.兰州交通大学 2014
[10]数据挖掘在计算机等级考试管理中的应用研究[D]. 郑秀月.福州大学 2014
本文编号:3098998
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3098998.html