旅客社会网络中的家庭出行预测及其行为特征分析
本文关键词:旅客社会网络中的家庭出行预测及其行为特征分析,,由笔耕文化传播整理发布。
【摘要】:近年来,旅游业蓬勃发展,居民旅游消费逐年攀升,乘坐飞机出行已经成为一种较为普遍的出行方式。与此同时,民航业的信息化程度大大提高,大量的旅客个人信息及其历史出行记录信息并未得到有效利用。如果能够从这些海量的信息中挖掘出具有价值的知识,对于实际的生产应用有着十分重要的意义。家庭是社会的基本单位,也是客运领域中最常见的出行消费单元之一。由于家庭出行受到时间、经济等多种因素的影响,因此家庭出行呈现出不确定性。如果能够准确地预测出家庭在未来一个时间段内是否出行,将有助于客运、酒店等服务业为家庭制定个性化的服务与产品,出行目的地的相关组织及时调整工作计划,从而提高家庭旅客出行的便捷度与满意度。本文对家庭出行进行了研究与定义并将预测一个家庭在未来一段时间是否会出行定义为一个分类问题。首先根据旅客的个人信息及其家庭的历史出行信息构建了家庭的人口统计学特征、历史行为特征以及预测时间窗口特征,这些特征描述了不同家庭的自然属性以及行为属性。为了达到更加理想的分类效果,还构建了基于共同出行关系的旅客社会网络,提出通过构建家庭成员社会网络的属性来进一步描述家庭特征。在此基础上使用多种分类算法进行家庭出行的预测。最后,我们对多种分类算法的效果进行了对比并对家庭团体的出行行为特征进行了统计。本文的实验数据基于民航领域的真实数据集。通过对比多种方案的多种分类器的分类效果,我们发现,针对民航旅客社会网络中的家庭出行预测问题,随机森林算法是效果最优的分类算法。实验结果表明,使用随机森林分类算法对家庭在未来一个月是否出行进行预测,准确率可以达到85%以上。针对家庭团体的出行行为特征统计分析结果也对于相关组织的决策者具有十分重要的参考价值。
【关键词】:旅客社会网络 家庭出行 出行预测 行为分析
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP301.6
【目录】:
- 致谢5-6
- 摘要6-7
- ABSTRACT7-11
- 1 引言11-16
- 1.1 研究背景11-12
- 1.2 研究目的及意义12
- 1.3 研究现状12-14
- 1.4 主要研究内容14-15
- 1.5 论文组织结构15-16
- 2 相关理论基础16-26
- 2.1 社会网络概述16-21
- 2.1.1 社会网络指标16-18
- 2.1.2 社会网络的基本性质18-21
- 2.2 分类算法21-24
- 2.2.1 传统分类算法21-23
- 2.2.2 组合分类算法23-24
- 2.3 家庭出行行为定义24-25
- 2.4 本章小结25-26
- 3 旅客社会网络中的家庭出行预测26-37
- 3.1 问题定义26-28
- 3.2 研究框架28
- 3.3 旅客社会网络构建28-29
- 3.4 家庭出行预测29-35
- 3.4.1 基于家庭基本属性的特征30-33
- 3.4.2 基于旅客社会网络的特征33
- 3.4.3 构建基于预测时间窗口的特征33-35
- 3.5 家庭出行行为特征统计35
- 3.6 本章小结35-37
- 4 实验与分析37-51
- 4.1 实验数据准备37-41
- 4.1.1 数据处理37-39
- 4.1.2 家庭数据库的建立39
- 4.1.3 样本标定39-41
- 4.1.4 实验环境41
- 4.2 实验结果41-49
- 4.2.1 出行预测42-46
- 4.2.2 家庭团体行为特征统计46-49
- 4.3 实验分析49
- 4.4 本章小结49-51
- 5 总结与展望51-53
- 5.1 本文工作总结51
- 5.2 不足与展望51-53
- 参考文献53-56
- 作者简历及攻读硕士学位期间取得的研究成果56-58
- 学位论文数据集58
【相似文献】
中国期刊全文数据库 前10条
1 刘足华;熊惠霖;;基于随机森林的目标检测与定位[J];计算机工程;2012年13期
2 董师师;黄哲学;;随机森林理论浅析[J];集成技术;2013年01期
3 王象刚;;基于K均值随机森林快速算法及入侵检测中的应用[J];科技通报;2013年08期
4 陈姝;彭小宁;;基于粒子滤波和在线随机森林分类的目标跟踪[J];江苏大学学报(自然科学版);2014年02期
5 罗知林;陈挺;蔡皖东;;一个基于随机森林的微博转发预测算法[J];计算机科学;2014年04期
6 王丽婷;丁晓青;方驰;;基于随机森林的人脸关键点精确定位方法[J];清华大学学报(自然科学版);2009年04期
7 李建更;高志坤;;随机森林针对小样本数据类权重设置[J];计算机工程与应用;2009年26期
8 张建;武东英;刘慧生;;基于随机森林的流量分类方法[J];信息工程大学学报;2012年05期
9 吴华芹;;基于训练集划分的随机森林算法[J];科技通报;2013年10期
10 张华伟;王明文;甘丽新;;基于随机森林的文本分类模型研究[J];山东大学学报(理学版);2006年03期
中国重要会议论文全文数据库 前7条
1 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
2 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
3 张天龙;梁龙;王康;李华;;随机森林结合激光诱导击穿光谱技术用于的钢铁分类[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
4 相玉红;张卓勇;;组蛋白去乙酰化酶抑制剂的构效关系研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
6 冯飞翔;冯辅周;江鹏程;刘菁;刘建敏;;随机森林和k-近邻法在某型坦克变速箱状态识别中的应用[A];第八届全国转子动力学学术讨论会论文集[C];2008年
7 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
中国博士学位论文全文数据库 前4条
1 曹正凤;随机森林算法优化研究[D];首都经济贸易大学;2014年
2 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
3 岳明;基于随机森林和规则集成法的酒类市场预测与发展战略[D];天津大学;2008年
4 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
中国硕士学位论文全文数据库 前10条
1 钱维;药品不良反应监测中随机森林方法的建立与实现[D];第二军医大学;2012年
2 韩燕龙;基于随机森林的指数化投资组合构建研究[D];华南理工大学;2015年
3 贺捷;随机森林在文本分类中的应用[D];华南理工大学;2015年
4 张文婷;交通环境下基于改进霍夫森林的目标检测与跟踪[D];华南理工大学;2015年
5 李强;基于多视角特征融合与随机森林的蛋白质结晶预测[D];南京理工大学;2015年
6 朱玟谦;一种收敛性随机森林在人脸检测中的应用研究[D];武汉理工大学;2015年
7 肖宇;基于序列图像的手势检测与识别算法研究[D];电子科技大学;2014年
8 李慧;一种改进的随机森林并行分类方法在运营商大数据的应用[D];电子科技大学;2015年
9 赵亚红;面向多类标分类的随机森林算法研究[D];哈尔滨工业大学;2014年
10 黎成;基于随机森林和ReliefF的致病SNP识别方法[D];西安电子科技大学;2014年
本文关键词:旅客社会网络中的家庭出行预测及其行为特征分析,由笔耕文化传播整理发布。
本文编号:341423
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/341423.html