基于民航订单数据的收益提升规则挖掘方法研究
发布时间:2020-12-25 12:12
随着民航客运机票电子化,机票分销渠道和模式发生变化,随之而来的问题也不断增加,如利用航空公司的收益漏洞抢占座位,这种行为导致大量座位被浪费,给航空公司造成巨大损失。针对上述问题,本文对民航旅客订单数据进行挖掘,寻找其中存在的民航收益漏洞规则,为航空公司的决策提供支持。本文需要对民航旅客订单数据进行预处理,从大规模的高维数据中提取与可疑订单相关的数据,进而从特征和订单细分两个角度对民航订单数据进行规则挖掘。首先,构建了基于L1正则化逻辑回归的民航可疑订单特征提取算法,该过程利用L1稀疏性对影响订单的特征进行提取,同时通过回归系数可以充分挖掘不同特征对订单是否出票的影响程度。其次,从订单细分角度,提出一种ELM特征空间的kmeans算法对民航旅客进行横向细分。通过利用ELM算法将样本特征非线性映射到高维特征空间中,再使用NMF进行特征降维,最后将特征样本通过kmeans算法进行细分。实验结果验证了该算法的区分能力,并最终将民航旅客订单数据划分为五类,有效挖掘出提升民航收益的规则,为航空公司收益提升提供支持。在规则挖掘的基础上,构建了一种基于PSO-ELM特征映射KNN分类算法的民航可疑订单...
【文章来源】:中国民航大学天津市
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
本文主要研究过程示意图
得到的回归系数如下表所示:表 3.2 逻辑回归系数特征 回归系数total_ppl_no -79.57total_seg_no -21.27last_cre_num 107.19has_cip 0.83is_married 0.32name_ppl_no 18.02orderseg 0.00orderstrptime 3.98isdaystart 0.07isdayend 0.00is_vip 0.00fly_time -0.39isweenkday 0.00
图 3-2 特征对因变量影响正负影响图述结果可以得到以下结论:以看出 L1 正则化逻辑回归经过训练,L1 正则化的稀疏性发挥了作orderseg、isdaystart、isdayend、is_vip、isweenkday 的回归系数都是数的值表示自变量与因变量的相关关系以及 L1 正则化的稀疏性理归系数的值都是 0 的特征与因变量即是否为可疑订单无关,因此可只保留绝对值不为 0 的值的 7 个特征。同时考虑到决策变量订单是到 8 个特征进行后续的研究。表 3.3 筛选样本后的特征回归系数特征 回归系数total_ppl_no -79.57total_seg_no -21.27last_cre_num 107.19has_cip 0.83
【参考文献】:
期刊论文
[1]民航NOSHOW预测及强因子关联分析[J]. 曹卫东,许代代,王静,王家亮. 计算机工程与应用. 2019(02)
[2]融合静电信号和气路参数的发动机性能评估方法[J]. 付宇,殷逸冰,冯正兴,左洪福,孙爽. 推进技术. 2019(02)
[3]基于ELM-KNN算法的网络入侵检测模型[J]. 顾兆军,李冰,刘涛. 计算机工程与设计. 2018(08)
[4]基于MapReduce的民航收益漏洞规则提取研究[J]. 曹卫东,翟盼盼,朱远知. 计算机仿真. 2017(12)
[5]民航收益漏洞NOSHOW规则提取[J]. 曹卫东,翟盼盼,朱远知. 计算机工程与设计. 2017(04)
[6]基于关联规则的机场航班地面保障模式研究[J]. 王尧. 科技与创新. 2017(02)
[7]基于ELM特征映射的kNN算法[J]. 卢诚波,林银河,梅颖. 复旦学报(自然科学版). 2016(05)
[8]基于高维数据的集成逻辑回归分类算法的研究与应用[J]. 毛林,陆全华,程涛. 科技通报. 2013(12)
[9]L1正则化Logistic回归在财务预警中的应用[J]. 刘遵雄,郑淑娟,秦宾,张恒. 经济数学. 2012(02)
[10]基于神经网络的某型飞机发动机故障诊断研究[J]. 刘艳春,杨德辉,刘艳丽,康建军. 电子设计工程. 2012(11)
博士论文
[1]航空旅客选择行为及其在收益管理中的应用研究[D]. 梅虎.南京航空航天大学 2007
[2]航空收益管理中舱位控制问题的研究[D]. 高强.南京航空航天大学 2006
硕士论文
[1]互联网背景下机票销售渠道演变的经济学分析[D]. 李晓彤.北京交通大学 2018
[2]发动机故障状态下的性能参数规律研究[D]. 刘乃彬.中国民航大学 2018
[3]基于光流特征的航站楼旅客异常行为识别方法研究[D]. 许莙苓.南京航空航天大学 2016
[4]基于聚类分析的机场客户细分服务系统的设计与实现[D]. 谢丽.西安电子科技大学 2014
[5]基于数据仓库与数据挖掘的航空货运分析CRM应用研究[D]. 迟晓明.中国海洋大学 2009
[6]航空公司收益管理中旅客舱位选择行为研究[D]. 王春兰.南京航空航天大学 2006
[7]基于数据仓库的航空货运分析型CRM研究[D]. 刘凤.南京航空航天大学 2004
本文编号:2937628
【文章来源】:中国民航大学天津市
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
本文主要研究过程示意图
得到的回归系数如下表所示:表 3.2 逻辑回归系数特征 回归系数total_ppl_no -79.57total_seg_no -21.27last_cre_num 107.19has_cip 0.83is_married 0.32name_ppl_no 18.02orderseg 0.00orderstrptime 3.98isdaystart 0.07isdayend 0.00is_vip 0.00fly_time -0.39isweenkday 0.00
图 3-2 特征对因变量影响正负影响图述结果可以得到以下结论:以看出 L1 正则化逻辑回归经过训练,L1 正则化的稀疏性发挥了作orderseg、isdaystart、isdayend、is_vip、isweenkday 的回归系数都是数的值表示自变量与因变量的相关关系以及 L1 正则化的稀疏性理归系数的值都是 0 的特征与因变量即是否为可疑订单无关,因此可只保留绝对值不为 0 的值的 7 个特征。同时考虑到决策变量订单是到 8 个特征进行后续的研究。表 3.3 筛选样本后的特征回归系数特征 回归系数total_ppl_no -79.57total_seg_no -21.27last_cre_num 107.19has_cip 0.83
【参考文献】:
期刊论文
[1]民航NOSHOW预测及强因子关联分析[J]. 曹卫东,许代代,王静,王家亮. 计算机工程与应用. 2019(02)
[2]融合静电信号和气路参数的发动机性能评估方法[J]. 付宇,殷逸冰,冯正兴,左洪福,孙爽. 推进技术. 2019(02)
[3]基于ELM-KNN算法的网络入侵检测模型[J]. 顾兆军,李冰,刘涛. 计算机工程与设计. 2018(08)
[4]基于MapReduce的民航收益漏洞规则提取研究[J]. 曹卫东,翟盼盼,朱远知. 计算机仿真. 2017(12)
[5]民航收益漏洞NOSHOW规则提取[J]. 曹卫东,翟盼盼,朱远知. 计算机工程与设计. 2017(04)
[6]基于关联规则的机场航班地面保障模式研究[J]. 王尧. 科技与创新. 2017(02)
[7]基于ELM特征映射的kNN算法[J]. 卢诚波,林银河,梅颖. 复旦学报(自然科学版). 2016(05)
[8]基于高维数据的集成逻辑回归分类算法的研究与应用[J]. 毛林,陆全华,程涛. 科技通报. 2013(12)
[9]L1正则化Logistic回归在财务预警中的应用[J]. 刘遵雄,郑淑娟,秦宾,张恒. 经济数学. 2012(02)
[10]基于神经网络的某型飞机发动机故障诊断研究[J]. 刘艳春,杨德辉,刘艳丽,康建军. 电子设计工程. 2012(11)
博士论文
[1]航空旅客选择行为及其在收益管理中的应用研究[D]. 梅虎.南京航空航天大学 2007
[2]航空收益管理中舱位控制问题的研究[D]. 高强.南京航空航天大学 2006
硕士论文
[1]互联网背景下机票销售渠道演变的经济学分析[D]. 李晓彤.北京交通大学 2018
[2]发动机故障状态下的性能参数规律研究[D]. 刘乃彬.中国民航大学 2018
[3]基于光流特征的航站楼旅客异常行为识别方法研究[D]. 许莙苓.南京航空航天大学 2016
[4]基于聚类分析的机场客户细分服务系统的设计与实现[D]. 谢丽.西安电子科技大学 2014
[5]基于数据仓库与数据挖掘的航空货运分析CRM应用研究[D]. 迟晓明.中国海洋大学 2009
[6]航空公司收益管理中旅客舱位选择行为研究[D]. 王春兰.南京航空航天大学 2006
[7]基于数据仓库的航空货运分析型CRM研究[D]. 刘凤.南京航空航天大学 2004
本文编号:2937628
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/2937628.html