基于数据挖掘的乘客出行行为研究
本文关键词:基于数据挖掘的乘客出行行为研究
更多相关文章: 数据挖掘 市民出行 特征工程 随机森林 梯度迭代决策树
【摘要】:随着城镇化建设速度不断加快,我国城镇化率从1978年的17.9%上升到2015年的56.1%,城镇常住人口突破7.7亿[1]。市民的出行需求也越来越大,道路交通流量呈现急剧增长,尤其在“北上广深”这样的大城市,诸如交通拥挤、市民出行不便等问题正在不断的增加,这些问题都严重影响到了城市居民的正常工作和生活,制约着城市的健康发展。公共交通作为城市交通运输重要的一个组成部分,在各城市中得到了很大的发展,然而在多数城市的公共交通的人数出行比占总出行还是偏低,其部分原因是由于公共交通的规划和策略制定与市民的出行之间的关系规律还存在着不一致。数据挖掘是目前智能系统的重要研究内容,它能够从大量的数据中挖掘隐藏在其中的规律和知识。本文基于广东省部分公交线路的历史公交卡交易数据,通过数据挖掘的技术和流程对固定人群在公共交通中的行为模式进行挖掘,分析推测乘客的出行习惯和偏好,最终建立模型预测人们在未来一周在固定公交线路上的出行情况,这对为广大乘客提供信息对称和安全合理的出行环境具有重要的意义。论文首先对数据挖掘技术理论背景和方法做了总体的介绍和分析,基于所有的数据,从实际业务的角度,对乘客在固定公交线路上未来的出行行为存在影响行为规律模式进行了一些探究,提出了一套反应乘客历史行为习惯和偏好的特征工程体系的构造方法。依据所设计的特征工程特点,以及对随机森林(random forest)和梯度迭代决策树(Gradient boosted decision tree)两种组合学习算法的理论分析和应用,建立了一个鲁棒性较好的市民未来出行预测模型,并在此基础上,对两种算法做了一系列分析和对比研究。
【关键词】:数据挖掘 市民出行 特征工程 随机森林 梯度迭代决策树
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:U491.1;TP311.13
【目录】:
- 摘要5-6
- Abstract6-10
- 第一章 绪论10-14
- 1.1 研究背景及意义10-11
- 1.2 国内外研究现状11-12
- 1.3 论文的主要研究内容和组织结构12-14
- 第二章 数据挖掘理论综述14-23
- 2.1 数据挖掘技术的概念14-16
- 2.2 数据挖掘的过程16-19
- 2.2.1 数据的预处理16-17
- 2.2.2 数据的挖掘阶段17
- 2.2.3 构建模型稳健型的评估以及结果的解释17-19
- 2.3 数据挖掘方法任务及分析19-22
- 2.4 本章小结22-23
- 第三章 乘客公交卡历史交易数据的预处理与特征设计23-32
- 3.1 原始数据23
- 3.2 交通刷卡群体数据的分析和预处理23-25
- 3.3 乘客公交历史交易数据的特征提取25-30
- 3.3.1 基于滑动窗口的特征集抽取26-27
- 3.3.2 乘客历史出行行为分析及样本特征设计27-30
- 3.4 本章小结30-32
- 第四章 随机森林和梯度迭代决策树算法介绍及其分析32-40
- 4.1 随机森林算法原理及其分析32-36
- 4.1.1 决策树算法32-34
- 4.1.2 算法随机性分析及oob估计34-35
- 4.1.3 算法收敛性证明35-36
- 4.2 梯度提升决策树(GRADIENT BOOSTING DECISION TREE)原理及其分析36-39
- 4.3 本章小结39-40
- 第五章 实验结果分析40-51
- 5.1 实验工具与平台介绍40
- 5.2 实验过程40-41
- 5.2.1 样本的构造40
- 5.2.2 模型的评估指标40-41
- 5.2.3 离线评测和线上评测41
- 5.3 随机森林的试验结果分析41-47
- 5.3.1 乘客在固定公交线路出行的离线测试结果分析41-45
- 5.3.2 乘客在固定公交线路出行的线上预测结果分析45-47
- 5.4 梯度迭代决策树实验结果分析47-49
- 5.4.1 乘客在固定公交线路出行的离线测试结果分析47-48
- 5.4.2 乘客在固定公交线路上出行的线上预测结果分析48-49
- 5.5 随机森林和梯度提升决策树结果对比分析49-51
- 第六章 总结与展望51-53
- 6.1 工作总结与创新51
- 6.2 工作展望51-53
- 参考文献53-55
- 攻读博士/硕士学位期间取得的研究成果55-56
- 致谢56-57
- 答辩委员会对论文的评定意见57
【相似文献】
中国期刊全文数据库 前10条
1 乌英格;陈宝平;;数据挖掘在客户关系管理中的应用[J];内蒙古科技与经济;2005年24期
2 焦健;王祥;;数据挖掘在美国本土安全中的应用[J];舰船电子工程;2006年01期
3 杨洋;;Web数据挖掘的分析与探讨[J];装备制造技术;2006年05期
4 刘娟;;Web数据挖掘及其在个性化网上购物实现的探讨[J];企业技术开发;2007年07期
5 李世超;麦范金;;数据挖掘在现代企业经营管理中的应用[J];桂林航天工业高等专科学校学报;2008年04期
6 崔永君;;数据挖掘的系统构成与发展趋势[J];硅谷;2009年03期
7 侯晓凌;;浅谈数据挖掘[J];科学之友(B版);2009年04期
8 张涛;;Web数据挖掘现状分析[J];科学之友(B版);2009年06期
9 黄雄伟;陈定方;祖巧红;;Web数据挖掘可视化研究与应用[J];湖北工业大学学报;2009年04期
10 王岩;;数据挖掘领域探索[J];硅谷;2010年05期
中国重要会议论文全文数据库 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
中国博士学位论文全文数据库 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年
6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年
7 何伟全;云南高校学生意外伤害因素关联规则挖掘及风险管控体系研究[D];昆明理工大学;2015年
8 段功豪;基于多结构数据挖掘的滑坡灾害预测模型研究[D];中国地质大学;2016年
9 白晓明;基于数据挖掘的复合材料宏—细观力学模型研究[D];哈尔滨工业大学;2016年
10 蓝永豪(LAM Wing Ho);基于数据挖掘技术分析当代中医名家痤疮验方经验研究[D];南京中医药大学;2016年
中国硕士学位论文全文数据库 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
,本文编号:827405
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/827405.html