基于多源出行数据的居民行为模式分析方法
【图文】:
?2)乘车日期(date):乘客刷卡上下车日期,格式为YYYY-MM-DD;3)乘车时间(time):乘客刷卡上下车时间,为24小时制;4)乘车站点(station):若类型为公交或地铁,则为公交线路或地铁站点,其他为无;5)乘车类型(type):公交、地铁、出租、轮渡、P+R停车场等多种乘车方式;6)消费金额(price):此次记录消费的金额;7)是否优惠(discount):根据交通部门制定的一些优惠政策对消费记录进行判定。1.2交通卡数据清洗城市交通卡数据由于网络传输、设备故障等原因存在数据丢失或产生脏数据,本文给出了对该类数据的清洗流程,如图1所示。数据清洗流程中给出了对应的清洗规则,该规则结合了该城市数据采集机制、刷卡优惠政策等,对数据的合理性进行评估。首先对交通卡数据按照交通卡编号和乘车时间排序;然后检查数据中是否存在时间格式错误的记录以及针对每名乘客每天是否存在单条地铁数据,若发现将其剔除;最后经过优惠政策的筛选得到清洗后的数据。图1中的优惠政策过滤模块主要针对地铁乘车记录。乘坐地铁每刷一次卡就会生成一条记录,乘坐地铁进出站各刷卡一次为完整的记录,因此处理数据时按照每两条进行处理,获取所有乘客列表,遍历每名乘客的乘车记录,具体流程如图2,其中cnt表示该用户的总记录数,idx表示当前乘客第idx条记录,idx+1<cnt表示当前处理的下一条记录序号小于记录总数。由于判断条件较多,为方便表示,图2中判断缺少的处理默认为:跳过当前记录,读取下一行。图1交通卡数据清洗流程Fig.1Cleaningprocessoftrafficcarddata图2优惠政策处理流程Fig.2Processofpreferentialpolicy图2中出站换乘规则具体如下:若在换乘站点出站后在间隔30min内再进站可以享受出站换乘连续计费。例如,某名乘客的一日乘坐地铁记录,共计n?
检查数据中是否存在时间格式错误的记录以及针对每名乘客每天是否存在单条地铁数据,若发现将其剔除;最后经过优惠政策的筛选得到清洗后的数据。图1中的优惠政策过滤模块主要针对地铁乘车记录。乘坐地铁每刷一次卡就会生成一条记录,乘坐地铁进出站各刷卡一次为完整的记录,因此处理数据时按照每两条进行处理,获取所有乘客列表,遍历每名乘客的乘车记录,具体流程如图2,其中cnt表示该用户的总记录数,idx表示当前乘客第idx条记录,idx+1<cnt表示当前处理的下一条记录序号小于记录总数。由于判断条件较多,为方便表示,图2中判断缺少的处理默认为:跳过当前记录,读取下一行。图1交通卡数据清洗流程Fig.1Cleaningprocessoftrafficcarddata图2优惠政策处理流程Fig.2Processofpreferentialpolicy图2中出站换乘规则具体如下:若在换乘站点出站后在间隔30min内再进站可以享受出站换乘连续计费。例如,,某名乘客的一日乘坐地铁记录,共计n条,其中第i条记录为:Ri:{uid,timei,stationi};1≤i≤n由于地铁记录进出站点刷卡两次为一条完整出行记录,所以按照每两条数据进行处理,一般情况下从station0站出发,中间经过站点stationi-1∈“换乘车站”出站,并且在30min内再次从该站点进站(即timei-timei-1≤30min),最后到达stationn站。系统会将票价连续计费,计算从station0站到stationn站的总费用。若n为奇数,且最后两条记录乘车站点为换乘车站,则说明最后一条表示从换乘车站出站。2基于LCS匹配的出行模式特征提取基于给定的清洗后的数据,本章将给出基于最长公共子序列(LCS)匹配的出行模式特征提龋首先对轨迹与站点序列等概念进行定义,然后给出基于站点序列等相似性度量方第8期徐晓伟等:
【参考文献】
相关期刊论文 前4条
1 许志榕;;上海市职住关系和通勤特征分析研究——基于轨道交通客流数据视角[J];上海城市规划;2016年02期
2 龙瀛;孙立君;陶遂;;基于公共交通智能卡数据的城市研究综述[J];城市规划学刊;2015年03期
3 李婷;裴韬;袁烨城;宋辞;王维一;杨格格;;人类活动轨迹的分类、模式和应用研究综述[J];地理科学进展;2014年07期
4 龙瀛;张宇;崔承印;;利用公交刷卡数据分析北京职住关系和通勤出行[J];地理学报;2012年10期
【共引文献】
相关期刊论文 前10条
1 徐晓伟;杜一;周园春;;基于多源出行数据的居民行为模式分析方法[J];计算机应用;2017年08期
2 李雅楠;徐鹤;王成新;;大数据在城市空间结构研究中的应用进展[J];工业经济论坛;2017年04期
3 韩龙玫;卿粼波;;视频大数据在城市公共空间规划领域的应用前景探索[J];四川建筑;2017年03期
4 尹凌;姜仁荣;赵志远;宋晓晴;李晓明;;利用手机通话位置数据估计城市24 h人口分布误差[J];地球信息科学学报;2017年06期
5 翁剑成;涂强;林鹏飞;徐硕;;票价调整对公交出行者出行选择的影响分析[J];武汉理工大学学报(交通科学与工程版);2017年03期
6 许园园;塔娜;李响;;基于地铁刷卡数据的城市通勤与就业中心吸引范围研究[J];人文地理;2017年03期
7 吴瑞君;朱宝树;古荭欢;;上海市就业人口的职住分离和结构分异[J];中国人口科学;2017年03期
8 邓羽;陈田;刘盛和;;城市物质空间更新研究进展与展望[J];地理科学进展;2017年05期
9 袁佳;杨东援;李玮峰;孙世超;;基于GPS数据的公交线路校核:以厦门市为例[J];综合运输;2017年05期
10 李东屹;;上海市现代有轨电车系统发展策略研究[J];城市轨道交通研究;2017年05期
【二级参考文献】
相关期刊论文 前10条
1 龙瀛;孙立君;陶遂;;基于公共交通智能卡数据的城市研究综述[J];城市规划学刊;2015年03期
2 钮心毅;丁亮;;利用手机数据分析上海市域的职住空间关系——若干结论和讨论[J];上海城市规划;2015年02期
3 李海波;陈学武;;基于公交IC卡和AVL数据的换乘行为识别方法[J];交通运输系统工程与信息;2013年06期
4 隋正伟;邬伦;刘瑜;;基于签到数据的城市间交互网络研究[J];地理与地理信息科学;2013年06期
5 关美宝;郭文伯;柴彦威;;人类移动性与健康研究中的时间问题[J];地理科学进展;2013年09期
6 秦萧;甄峰;熊丽芳;朱寿佳;;大数据时代城市时空间行为研究方法[J];地理科学进展;2013年09期
7 申悦;柴彦威;;基于GPS数据的北京市郊区巨型社区居民日常活动空间[J];地理学报;2013年04期
8 陈君;杨东援;;基于智能调度数据的公交IC卡乘客上车站点判断方法[J];交通运输系统工程与信息;2013年01期
9 桂智明;向宇;李玉鉴;;基于出租车轨迹的并行城市热点区域发现[J];华中科技大学学报(自然科学版);2012年S1期
10 龙瀛;张宇;崔承印;;利用公交刷卡数据分析北京职住关系和通勤出行[J];地理学报;2012年10期
【相似文献】
相关期刊论文 前10条
1 陈冬牛;用于零件成组的多目标聚类分析[J];成组生产系统;1986年01期
2 蔡建国;;排序聚类分析在成组技术中的应用[J];机械工艺师;1985年01期
3 董玉祥;排序聚类分析计算程序[J];成组生产系统;1986年01期
4 A·Gongaware,Inyong Ham,焦虹;用于成组制造系统的聚类分析法[J];成组生产系统;1986年02期
5 史逸芬,蔡建国;排序聚类分析法在相似零件成组中的应用[J];成组生产系统;1986年03期
6 吴国安;聚类分析在鸟的分类中的应用[J];黑龙江大学自然科学学报;1989年04期
7 卢泽生;;零件分类成组的聚类分析法[J];机械工程师;1990年04期
8 高伟平;;聚类分析在化学中的应用及在可编程序计算器上的实现[J];化学工程师;1990年06期
9 陈艾荷;;一种基于非线性映射的聚类分析[J];武测科技;1992年03期
10 田盛丰;;聚类分析方法[J];计算机研究与发展;1992年03期
相关会议论文 前3条
1 李辉;蔡敏;;基于聚类分析的数字通信信号的分类[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 龚毅;何琳华;;企业技术扫描模式聚类分析[A];第十一届中国青年信息与管理学者大会论文集[C];2009年
3 胡立;陈健;沈书毅;黄晋;;基于用户轨迹聚类分析的推荐算法研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
相关博士学位论文 前2条
1 张建萍;基于计算智能技术的聚类分析研究与应用[D];山东师范大学;2014年
2 李成安;分布式环境下聚类分析新方法的研究[D];浙江大学;2006年
相关硕士学位论文 前10条
1 冯雪冰;基于模糊理论的EM算法在聚类分析的应用研究[D];中国地质大学(北京);2015年
2 周颖;基于蚁群算法的聚类分析在学生成绩中的研究[D];南昌大学;2015年
3 王帅宇;K-Means算法在用户细分方面的应用研究[D];北京理工大学;2015年
4 张玉超;公安重点关注对象的聚类分析研究[D];山东大学;2015年
5 冯棣夫;聚类分析在H银行客户分类中的应用[D];华南理工大学;2015年
6 王伟;基于聚类分析的社会网络社团划分方法研究[D];南京邮电大学;2015年
7 栾海洋;动车组质量数据聚类分析研究与应用[D];北京交通大学;2016年
8 王冰冰;双类型信息网络聚类分析[D];吉林大学;2016年
9 李萌萌;基于Hadoop的聚类分析研究[D];昆明理工大学;2016年
10 李林;基于聚类分析和决策树算法的交通流量挖掘[D];江苏科技大学;2016年
本文编号:2575558
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2575558.html