旅客同行社交网络关系预测研究
发布时间:2021-07-20 04:18
旅客同行关系作为一种特殊的社交关系在民航领域有着重要的研究意义与应用前景。民航旅客同行关系网络预测旨在对由民航旅客为节点,旅客共同出行关系为边的同构网络进行链接预测。对于机场,挖掘旅客的同行关系可以精进机场的黑白分级安检环节,这将大大提高机场整体的运行效率;对于航空公司来说,构建完整的旅客同行网络,可以针对旅客精准的进行航线推荐。而对于旅客本身来说,对旅客同行关系网络的预测也可以极大保障旅客的人身安全。由于民航旅客同行网络中旅客节点数量庞大但边极为稀少,使得网络具有高度稀疏的特点,而现有社交网络链接预测方法多数是基于相似度算法来对稠密图节点之间的关系强度分析并预测,因此不适用于高度稀疏的民航旅客同行网络链接预测。因此本文首先提出在海量的民航旅客订座记录的基础上,将有限的散列字段转换为网络数据,构建旅客同行关系网络。接着在该网络数据中深入挖掘旅客对之间的关系特征并进行提取以及细化,将提取后的旅客同行关系特征进行特征向量化,生成特征矩阵作为分类器的训练数据,并在四种不同的分类器下均取得了较好的预测结果,证明了提取后的旅客同行关系特征属性具有良好的有效性及适用性。在旅客同行关系特征获取的基础...
【文章来源】:中国民航大学天津市
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
某机场某一时段旅客同行网络生成图 民航旅客同行网络的链接预测本质上是在海量的散列数据中对其进行网络
中国民航大学硕士学位论文 8 图2-1一个简单的社交关系图2.1.2基本性质(1)六度分隔理论1967年,哈佛大学的心理学教授StanleyMilgram提出“在世界上任何一个人与其相对的任何一个陌生人之间所间隔的人不会超过五个,也就是最多通过六个人就可以认识任何一个陌生人”的概念,称为“六度分隔理论”[7]。该理论即描绘了一个连结人与社区的社交关系网。在现实社会中绝大部分社交关系网络中都符合六度分隔理论,比如论文合著关系网络,各种社交网络平台的用户关系网,这些网络虽然规模大,但其中的节点平均最短距离均小于6,形成巨大网络中的小世界特性。(2)中心性性质“中心性”是社交网络分析中不可缺少的一项重要指标。它旨在衡量一个节点在该所属网络下的权力占比,中心性分析则是节点权力的量化研究[8]。对于社交网络研究学者来说,权力在社交网络中个体或组织如何的重要,或者是说具有怎样的中心地位成为最早也是最核心深入研究的内容之一。个体的中心度(Centrality)衡量个体处于网络中心的程度,反映了该节点在网络中的重要性程度。因此一个网络中的节点数量等于个体的中心度数量。此外,不仅可以计算网络中个体的中心度,还可以计算整个网络的集中趋势(可简称为中心势)(Centralization)。与个体中心度描述的中心思想不同在于,网络中心势描述整张网络中各个节点的差异性程度。因此一个网络只有一个中心势。根据计算方法的不同,中心度和中心势都可以分为三种:点度中心度与点度中心势,中间中心度与中间中心势,接近中心度与接近中心势。
中国民航大学硕士学位论文 17 3.1.2数据分析及问题提出根据中航信近某两年的PNR进行统计发现,旅客节点总数为180451121,而边总数只有24503142,平均节点度为0.13,旅客同行数据高度稀疏。图3-2显示了同样两年间同行旅客订单数统计,共74461114单订单,其中单人行程订单数占总订单数的82.79%,可用于研究的同行旅客数据只占总数据的不到18%,不仅证明旅客同行网络的极强稀疏性,更说明了在订单数据中表现出的同行关系十分稀少。 图3-2中航信201X年到201X+1年PNR数据同行旅客订单数统计(总订单数:74461114)如何对已构建的具有极强稀疏性的旅客同行关系网络利用有限的数据字段进行非拓扑特征的挖掘及发现并提取细化,以达到对具有同行关系的旅客对的关系表达,是当前对于民航旅客同行关系网络来说是一大难点,也是是本章的研究重点。3.2旅客同行关系特征提取3.2.1同行关系特征群分类将每条PNR的属性字段进行筛选并分类为每对节点的三种信息特征群[26-27],即旅客个人信息特征群、航班信息特征群和旅客行为信息特征群。三种信息特征群包括的所有属性字段定义如表3-2。82.79%12.66%1.41%1.43%1.70%单人出行2人同行3人同行4人同行5人以上同行
【参考文献】:
期刊论文
[1]基于ARIMA和BP神经网络的民航事故征候率预测[J]. 陈芳,张迪,卫微,郭娜. 安全与环境学报. 2019(06)
[2]中国民航客运市场需求预测的系统动力学模型研究[J]. 沈静瑶,曾小舟,邬国祥. 华东交通大学学报. 2019(04)
[3]面向乘客策略行为的航空公司舱位控制与动态定价模型[J]. 李豪,彭庆,谭美容. 控制与决策. 2018(07)
[4]自动关键词抽取研究综述[J]. 赵京胜,朱巧明,周国栋,张丽. 软件学报. 2017(09)
[5]基于旅客分类的机场安检系统研究[J]. 赵振武,唐玉丽,麻建军. 综合运输. 2017(03)
[6]中文文本语义错误侦测方法研究[J]. 张仰森,郑佳. 计算机学报. 2017(04)
[7]一种大规模网络中基于节点结构特征映射的链接预测方法[J]. 李志宇,梁循,周小平,张海燕,马跃峰. 计算机学报. 2016(10)
[8]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼. 计算机学报. 2017(03)
[9]改进二部分图的民航旅客出行偏好模式的构建[J]. 贺怀清,李图波. 计算机应用与软件. 2015(02)
[10]一种基于社交网络的民航新旅客成长性预测方法[J]. 林友芳,张奥爽,万怀宇,武志昊. 北京交通大学学报. 2014(06)
本文编号:3292111
【文章来源】:中国民航大学天津市
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
某机场某一时段旅客同行网络生成图 民航旅客同行网络的链接预测本质上是在海量的散列数据中对其进行网络
中国民航大学硕士学位论文 8 图2-1一个简单的社交关系图2.1.2基本性质(1)六度分隔理论1967年,哈佛大学的心理学教授StanleyMilgram提出“在世界上任何一个人与其相对的任何一个陌生人之间所间隔的人不会超过五个,也就是最多通过六个人就可以认识任何一个陌生人”的概念,称为“六度分隔理论”[7]。该理论即描绘了一个连结人与社区的社交关系网。在现实社会中绝大部分社交关系网络中都符合六度分隔理论,比如论文合著关系网络,各种社交网络平台的用户关系网,这些网络虽然规模大,但其中的节点平均最短距离均小于6,形成巨大网络中的小世界特性。(2)中心性性质“中心性”是社交网络分析中不可缺少的一项重要指标。它旨在衡量一个节点在该所属网络下的权力占比,中心性分析则是节点权力的量化研究[8]。对于社交网络研究学者来说,权力在社交网络中个体或组织如何的重要,或者是说具有怎样的中心地位成为最早也是最核心深入研究的内容之一。个体的中心度(Centrality)衡量个体处于网络中心的程度,反映了该节点在网络中的重要性程度。因此一个网络中的节点数量等于个体的中心度数量。此外,不仅可以计算网络中个体的中心度,还可以计算整个网络的集中趋势(可简称为中心势)(Centralization)。与个体中心度描述的中心思想不同在于,网络中心势描述整张网络中各个节点的差异性程度。因此一个网络只有一个中心势。根据计算方法的不同,中心度和中心势都可以分为三种:点度中心度与点度中心势,中间中心度与中间中心势,接近中心度与接近中心势。
中国民航大学硕士学位论文 17 3.1.2数据分析及问题提出根据中航信近某两年的PNR进行统计发现,旅客节点总数为180451121,而边总数只有24503142,平均节点度为0.13,旅客同行数据高度稀疏。图3-2显示了同样两年间同行旅客订单数统计,共74461114单订单,其中单人行程订单数占总订单数的82.79%,可用于研究的同行旅客数据只占总数据的不到18%,不仅证明旅客同行网络的极强稀疏性,更说明了在订单数据中表现出的同行关系十分稀少。 图3-2中航信201X年到201X+1年PNR数据同行旅客订单数统计(总订单数:74461114)如何对已构建的具有极强稀疏性的旅客同行关系网络利用有限的数据字段进行非拓扑特征的挖掘及发现并提取细化,以达到对具有同行关系的旅客对的关系表达,是当前对于民航旅客同行关系网络来说是一大难点,也是是本章的研究重点。3.2旅客同行关系特征提取3.2.1同行关系特征群分类将每条PNR的属性字段进行筛选并分类为每对节点的三种信息特征群[26-27],即旅客个人信息特征群、航班信息特征群和旅客行为信息特征群。三种信息特征群包括的所有属性字段定义如表3-2。82.79%12.66%1.41%1.43%1.70%单人出行2人同行3人同行4人同行5人以上同行
【参考文献】:
期刊论文
[1]基于ARIMA和BP神经网络的民航事故征候率预测[J]. 陈芳,张迪,卫微,郭娜. 安全与环境学报. 2019(06)
[2]中国民航客运市场需求预测的系统动力学模型研究[J]. 沈静瑶,曾小舟,邬国祥. 华东交通大学学报. 2019(04)
[3]面向乘客策略行为的航空公司舱位控制与动态定价模型[J]. 李豪,彭庆,谭美容. 控制与决策. 2018(07)
[4]自动关键词抽取研究综述[J]. 赵京胜,朱巧明,周国栋,张丽. 软件学报. 2017(09)
[5]基于旅客分类的机场安检系统研究[J]. 赵振武,唐玉丽,麻建军. 综合运输. 2017(03)
[6]中文文本语义错误侦测方法研究[J]. 张仰森,郑佳. 计算机学报. 2017(04)
[7]一种大规模网络中基于节点结构特征映射的链接预测方法[J]. 李志宇,梁循,周小平,张海燕,马跃峰. 计算机学报. 2016(10)
[8]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼. 计算机学报. 2017(03)
[9]改进二部分图的民航旅客出行偏好模式的构建[J]. 贺怀清,李图波. 计算机应用与软件. 2015(02)
[10]一种基于社交网络的民航新旅客成长性预测方法[J]. 林友芳,张奥爽,万怀宇,武志昊. 北京交通大学学报. 2014(06)
本文编号:3292111
本文链接:https://www.wllwen.com/shoufeilunwen/boshibiyelunwen/3292111.html