基于新浪微博的公交系统数据采集及分析
发布时间:2017-06-27 07:17
本文关键词:基于新浪微博的公交系统数据采集及分析,,由笔耕文化传播整理发布。
【摘要】:为充分利用大数据时代的海量数据,提出一种基于新浪微博的公交系统数据采集及分析方法。通过Web Crawler从新浪微博抓取所需时空范围内的公交微博,分析公交微博发布的时间与空间分布规律;随后采用KMP算法统计并剔除冗余转发及回复微博,提取并分析公交相关的热点话题;基于中科院ICTCLAS算法进行中文分词处理,删除停用词后统计词频,生成关键词的词云。最后通过南京市范围内的8 913条公交微博进行实例验证与分析,结果表明,该方法可以从海量的微博数据中提取公交相关数据并进行分析,分析数据量大且有时效性,分析结果可为公交系统管理的优化与改善、公交政策的制定提供数据支撑。
【作者单位】: 河海大学商学院;东南大学交通学院;
【关键词】: 微博 公交系统 数据抓取 中文分词 大数据
【分类号】:TP391.1;TP393.092
【正文快照】: 0引言现代交通科学是一门多学科交叉与多技术融合的科学,其研究工作很大程度上是基于对交通数据的采集与分析而逐层展开的。传统的交通数据采集方法为交通调查,至今已有超过75年的历史[1],主要是通过邮件、电话、网络、入户、街访等方式展开。近年来,为了弥补传统方法不能获取
【相似文献】
中国期刊全文数据库 前3条
1 尹若波,于连家,扈兴强,赵亚男;FRDPP信息工程管理系统数据采集、录入技术及功能实现的探讨[J];山东林业科技;1999年S1期
2 张柯,张新宇,鞠儒生,邱晓刚;基于HLA的分布仿真系统数据采集解决方案[J];系统仿真学报;2004年12期
3 ;[J];;年期
中国硕士学位论文全文数据库 前1条
1 拜战胜;SNAX系统数据采集研究[D];中南大学;2009年
本文关键词:基于新浪微博的公交系统数据采集及分析,由笔耕文化传播整理发布。
本文编号:488919
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/488919.html