民航旅客团体出行目的及出行网络分类推断研究与应用
【摘要】 在现实生活中,人们常常因为拥有相同的出行目的地而组成一个旅客团体共同乘机出行。推断民航旅客团体出行目的是一个非常有趣且有价值的研究问题,因为推断结果能为各个航空公司、航空管理部门甚至政府的服务及决策提供支撑,从而带来有意义变化。在本文中,我们尝试在乘客的旅行历史记录数据基础上通过设计分类算法来解决这个问题。为克服传统分类器的独立同分布(IID)假设的约束,本文提出一种基于迭代分类的新型集体分类方法。首先,我们从民航相关部门提供的加密旅客出行记录中抽取出旅客间的社会关系,并基于这些关系构建民航旅客共同出行网络。在共同旅行网络基础上,进一步构造了一组特征指标用于描述不同类别的民航旅客团体,然后使用这些特征指标对旅客团体进行初步预分类。在预分类以后,我们使用集体分类的思想,利用不同旅客团体之间的重叠部分形成类别标签,再使用这个标签不断进行迭代分类,当结果稳定时迭代终止。我们在民航乘客的旅行记录真实数据集上进行了实验,结果表明集体迭代分类方法可以有效地推断民航旅客团体旅行目的。最后,我们将旅客团体出行目的推断方法应用于不同城市出发达到旅客团体的出行目的推断,并利用推断结果有效地分析城市的性质与发展趋势。
第一章引言
1.1研究背景
自二十一世纪以来,随着民航业务的高速发展与人民生活水平的逐渐提高,乘机出行方式由于拥有机动性高、速度快,并且安全舒适等等诸多优势,越来越多的受到人们的青睐,成为出行的主要选择之一。
据国家民航局统计,截止2011年年底,全国共有公用颁证机场180个,民航全行业运输飞机在册1764架数架,覆盖了全国的经济总量76%的人口和70%的县级行政单位。而在2012年,全国民航业已经完成旅客运输量3.2亿人次。这些都表明了民航在我国经济发展与旅客运输方面扮演着极其重要的角色,而且,民航业务的高速发展,也预示着民航的重要性在未来会更加凸显。
民航领域的信息化也随着民航业务的蓬勃发展不断深入完善,民航的信息化系统离港系统、订票系统和航班进出港系统积累了大量的数据。这些数据既包括乘机旅客的个人信息,也包括了这些旅客的订票、值机与旅程信息。由于每年旅客人次数量级别达到,所以民航的信息系统拥有了海量的旅客数据。
但是,如果存储的这些海量数据不加以分析利用,不仅是一种资源浪费,更是一种存储负担。我所在的科研团队致力于这些海量数据的挖掘与研宄,并取得了一系列的科研成果。其中一项成果就是首先提出并建立了民航共同旅行网络网络基于将民航旅客之间共同旅行次数作为旅客之间的关系建立,可以较好的反映旅客之间的关系。
基于共同旅行网络,结合民航业务和其他组织部门的实际需求,笔耕文化推荐期刊,可以进行更加深入的研宄与分析。从而为民航或者其他组织部门提供相应的数据分析与决策支持。
1.2研究目的与意义
本文研究的主要目的是对民航旅客团体的出行目的进行推断,并探索其应用方向。
民航旅客团体是指在一个旅客订座记录中,订票的旅客人数大于等于10人的旅客群体。民航旅客团体订票具有很强的指向性与目的性。因为乘机出行基本是远距离、高成本的,所以当一个团体决定一起乘机去往某个地点时,可以看成他们是经过仔细筹划,有一定指向性与目的性的,这样可以基本排除出行目的的随意性与偶然性。
由于旅客团体具有出行目的单一明确的特征,若我们能对到达某个地区或从某个地区出发的旅客团体进行出行目的推断,将会具有许多潜在的应用。例如,计算具有不同出行目的类型的旅客团体比例,可以了解一个地区的“吸引力”与“注意力”。“吸引力”与“注意力”是指从一个地区出发或到达一个地区的旅客团体目的的倾向性;通过观察不同出行目的类型旅客团体的数量变化,可以了解一个地区某方面发展与变化趋势,这些分析结果能够为该地区的政府规划提供决策数据支持;再如,因为旅客团体又具有行动的相对统一性,因此对某个线路的旅客团体进行目的推断后,该线路的服务部门能够基于推断结果,调整服务策略和计划,使线路服务更加人性化与个性化;旅客团体出行目的推断结果结合时间进行综合分析,则可以为商务机构的市场细分规划、广告投放的策略调整等提供依据。同时,其研究成果也可以改进后推广到其他交通行业,为其行业的服务升级与规划提供帮助。因此,推断旅客团体的出行目的,具有非常重要的实用价值。
第二章旅客团体出行目的推断
本章主要介绍推断民航旅客团体出行目的的方法。如上文所提到的,我们将推断民航旅客出行目的转化为一个分类问题。
而为旅客团体出行目的进行分类,需要构建旅客团体的特征属性来描述旅客团体。由此,我们首先构造了旅客团体的基本属性,包括人口统计学特征、旅客团体特征和旅客团体成员历史特征等方面。但是由于不同旅客团体之间存在成员重叠现象,不满足分类算法中分类对象独立同分布的要求,因此我们构造了旅客共同出行网络,通过共同出行网络来构建旅客团体的网络属性,更加全面地对旅客团体进行描述。
最后,我们在逻辑回归分类的基础上,对团体间重叠旅客间关系进行出行目的倾向性分析,并将分析结果作为一个特征属性进行分类与迭代,最终获得分类结果。
2.1构建共同旅行网络
为了获取旅客团体成员间的关系属性,我们需要利用旅客共同行为的记录来需要构建共同旅行网络。这些同行记录来自民航领域的旅客订票记录。
在构建共同旅行网络时,我们将一个旅客对应为网络中的一个节点;若一对旅客之间存在共同出行的关系,则将这种关系对应为这对旅客之间的一条边,这条边的权重对应旅客间共同出行的次数。这样,所有的节点与边、边权重就构成了共同旅行网络。其构建方法如表2-2所示。
2.2特征属性
在构建好共同旅行网络之后,我们需要进行分类特征属性构造。特征属性可以分为两大类。
第一类是旅客团体的客观属性,客观属性来自旅客团体以及团体成员的客观事实属性,可以使用年龄、性别和组成人数等方面属性来描述团体的差异,数据可以通过旅客团体购票时填写的相关信息获得;另一类是旅客团体的网络属性,网络属性来自共同旅行网络,可以使用团体关系结构、团体关系总强度等方面来描述不同团体的差异。下面就分别从这两个方面对分类属性集进行描述。
2.2.1基本属性
基本属性集的特征属性属于实际存在的事实,我们通过分析不同性质的旅客团体可能存在的客观差异,结合社会学、旅游学等相关方面的知识,构造出人口统计学特征、旅客团体整体特征、成员历史行为特征三个方面的属性。
人口统计学特征用于表征旅客团体的人口组成结构,描述主要影响旅客团体行为的人口统计学特征,为分析不同性质旅客团体的影响因素提供参考例如在年龄方面,商务团体往往是由成年人构成,而旅游团体的年龄构成则相对宽泛,未成年人与老年人均会存在,且年龄在20岁至30岁之间的年轻人逐渐成为旅游群体的主力。而且随着旅游的发展,越来越多的“夕阳游”、“少年夏令营”针对某种年龄段的旅游形式开始出现,因此会出现指定年龄段人员方面差异。
旅客团体整体特征可以表征旅客团体此次出行的相关行为属性,作为整个团体的整体行为的统一表现。例如在旅客团体是否返程上,旅游团体往往行动一致,会统一购买返程票;而商务团体在到达目的后个人活动较多,所以一般不会统一购买返程票。不同性质的旅客团体成员之间的行为和关系也存在差异,因此这些团体成员到达交通枢纽、登上交通工具的顺序以及在交通工具的座位关系也会有较大不同。
而旅客团体成员的历史行为信息可以从一个方面反映旅客出行目的的偏好。例如团体成员的历史总里程和出行次数等等。
基本属性的形式化如表2-3所示。
第三章实验与分析.........16
3.1推断数据集.......16
3.2样本采集.......16
3.2.1旅游渠道.......17
第四章旅客团体出行目的应用.......48
4.1旅客团体与城市类型的关系.......48
4.1.1商务城市........48
4.1.2旅游城市.....52
第五章结论.......62
第四章旅客团体出行目的应用
本章主要探索旅客团体出行目的的应用领域以及方式方法。
其中4.1主要对旅客团体与城市类型关系的应用进行了探索与研究,4.2从基础特征、结构特征等方面对商务团体与旅游团体进行对比分析,并尝试进行一定的应用分析。
4.1旅客团体与城市类型的关系
当我们能够对到达某个地区或从某个地区出发的旅客团体进行出行目的推断,将会具有许多潜在的应用。例如,计算具有不同出行目的类型的旅客团体比例,可以了解一个地区的“吸引力”与“注意力”。“吸引力”与“注意力”是指从一个地区出发或到达一个地区的旅客团体目的的倾向性;通过观察不同出行目的类型旅客团体的数量变化,可以了解一个地区某方面发展与变化趋势,这些分析结果能够为该地区的政府规划提供决策数据支持。
本节从实际数据中选取了几座不同类型的城市,对到达这些城市的旅客团体进行了出行目的推断与分析。
4.1.1商务城市
如在文中所提到的,商务团体的定义是以到外地幵会、学习、考察、谈判和参加会展等为目的,由较强组织性与目的性的旅客团体。
由此可知,商务城市应该包括重工业城市、枢纽城市、贸易城市、能源城市以及会展城市。根据以上标准,分别选取了南通、大同两座城市作为商务城市进行分类。其中会展城市南通的选取是从中国会展联盟加盟城市中选取而来。
1)数量分布
城市的数量分布是指到达该城市的旅客团体中,两种性质类别的不同团体的总数,其分布如表4-1所示。
2)时间分布
针对每一个城市不同类别的旅游团体,在时间分布上也存在较大区别,以下是按照月份划分的各个不同城市的时间分布图。
第五章结论
在本文中,我们提出了一种如何推断旅客团体出行目的的方法。该方法的思路是将推断旅客团体出行目的转化为一个分类问题。针对这个问题,我们首先通过构造旅客团体的基本属性对旅客团体进行初步描述,接着建立了能够反映旅客间关系的旅客共同出行网络,并基于此网络再次构造网络属性对旅客团体进行深层次的描述,并使用特定的分类算法对旅客团体进行初步分类;最后在初步分类的基础上,对旅客团体成员之间的关系进行出行目的倾向性分析,并将分析结果作为一个特征属性迭代到分类过程中去,通过不断迭代来对旅客团体出行目的进行推断,取得了较好的效果。
在获取了分类模型后,我们对到达不同类型的城市(商务、旅游和综合)的旅客团体进行了分类。在分类结果中,我们统计了不同类型城市的不同类型旅客团体的数量分布、时间分布以及来源城市分布,并将统计结果与实际的城市定位进行了对比。对比结果从一个侧面反映了分类模型的正确性。我们从基本特征与网络特征两个方面对不同类型的旅客团体进行了对比,分析了它们之间的差异与联系,并对差异与联系做了一定的分析。
推断旅客团体出行目的的应用前景广阔,是一个全新的研宄方向。未来的工作中,我们还可以对旅客团体的出行目的深层次的细分,为销售组织的个性化销售提供数据支持;或者进一步研宂不同出行目的的旅客团体的构成特征与行为规律,为旅客服务部门制定服务策略提供决策依据。跟进一步,还能应用到多种社会关系的团体分析场合,成为一个较为通用的问题解决方案。
参考文献:
[1] 张林衡. 虚拟学习社区的设计与实现[D]. 北京交通大学 2014
[2] 侯志鑫. 移动学习环境下学习资源建设模式的研究[D]. 北京交通大学 2014
[3] 张瑞玲. 教学资源自动文摘系统的研究与设计[D]. 北京交通大学 2014
[4] 王漪. 文本挖掘技术的研究及其在教学平台中的应用[D]. 北京交通大学 2014
[5] 万聪. 网络问卷调查系统分析与设计[D]. 北京交通大学 2014
[6] 杨斯崑. 基于主题相关性的社交问答系统个性化专家排序算法的研究[D]. 北京交通大学 2014
[7] 兰鹏. 基于出行目的链的轨道交通客流预测模型研究[D]. 北京交通大学 2009
[8] 刘咏. 城市对外综合客运枢纽功能定位及相关问题研究[D]. 西南交通大学 2008
[9] 陈卓. 城市居民对外出行方式选择研究[D]. 西南交通大学 2007
本文编号:11012
本文链接:https://www.wllwen.com/guanlilunwen/lvyoujiudianguanlilunwen/11012.html