当前位置:主页 > 科技论文 > 自动化论文 >

基于粗糙集的铁路列车客票收入知识发现及预测模型研究

发布时间:2020-04-09 07:09
【摘要】:为了更合理地提高铁路客票收入,分配运输资源,管理部门会根据既有列车客票收入情况、开行情况、沿途车站发送旅客人数等因素形成一张收入决策表,依据此对新开行列车客票收入进行预测,这样既可以更合理地为铁路局下达下一阶段的客运收入指标,也为管理部门有效地进行成本控制和客运组织提供了保障。但是,随着我国高速铁路网络建设的飞速发展,列车开行情况更加复杂多样。面对新的形式,相关管理人员仍然凭借经验或人工干预的方式对影响客票收入的因素进行处理,再根据这些处理的结果对客票收入进行预测。实践证明,其结果已经不能满足预算工作的需要。目前,基于粗糙集理论方法的知识发现模型已被应用于多个领域,并且取得了比较显著的效果。但是,应用于旅客列车客票收入知识发现和预测仍处于起步阶段。由于影响铁路客票收入的因素较多,数据类型复杂、具有非线性、高噪音等特征,因此,本文提出了一个基于粗糙集的客票收入知识发现和预测模型,利用其挖掘出客票收入知识背后潜在的规则,形成一套能够对客票收入进行有效预测的知识发现模型系统,在理论和实际应用方面都具有重要意义。本文将列车整体和沿途各站客票收入作为研究对象,在模型中构建了数据预处理、基于粗糙集的知识发现、收入预测等三个模块。在第一个模块中,针对客票收入知识发现的数据特点,提出了一种“K-means-CACC”算法对目标变量进行离散化处理,此算法避免了非监督离散化方法忽略数据分布信息、区间边界确定不具有代表性等缺点。在第二个模块中,基于粗糙集理论方法计算条件属性对决策属性的依赖程度,采用基于核属性的启发式约简算法将初始决策表中的冗余属性进行约简;采用随机森林算法构建客票收入知识发现规则,此方法避免了关联分析方法无法计算出规则和产生矛盾规则的问题。最后,基于上述生成的知识规则库,本文提出了“粗糙集-集成学习”模型对客票收入进行预测,此模型将深度神经网络长短期记忆法LSTM(Long short-term Memory)、XGBoost(Extreme Gradient Boosting)算法和基于误差区间交集的目标选取算法作为个体学习器分别进行收入预测,再按照Stacking集成算法进行融合。在论文的最后,针对各模块中提出和利用的方法,依据实际客票营销数据进行了有效性验证。验证结果表明,上述方法能够有效地形成简明、易于理解的决策表并且较现行方法能够更精确地对客票收入进行预测。
【图文】:

论域,边界域,不确定,包价


RXxUxXR| (公式 2-3 所示,边界域可以定义为: BNXRXRXR (域表示论域边界的不确定域,即不能确定属于边界域的那些元素被确切地 或 X 的补集。可以引申出正负区域的概念,如公式 2-4 所示,正区域可以被定义为: POSXRXR (示知识能完全属于集合 X 。式 2-5 所示,负区域可以被定义为: NEGXURXR (示知识不确定属于集合 。,,X 为U 的子集,即 X U,根据R 的描述来划分集合 X 。设 Rx 表示包价类,其中 x为论域U 元素。当 RXRX 时,就称 X 就是粗糙的。

过程图,知识发现,过程,决策属性


图 2-2 基于粗糙集理论方法的知识发现过程Figure 2-2 Knowledge Discovery Process Based on Rough Set Theory准备和预处理据准备是指用户在数据准备阶段根据业务需求抽取数据,形成待处理数是指消除待处理数据中的冗余,错误,噪声,重复等数据。对于本文讨论集理论方法的要求,需要将连续性数据通过相关算法转化为离散型数据化决策表过数据准备和预处理,根据业务需求,在数据表中定义条件属性和决策)构成初始决策表。在表中,决策属性是知识发现的目标,条件属性是对决策属性产生影响的因素。定性度量量自然现象的不确定性程度称为不确定性度量。如前面论述的一样,粗能够处理具有不精确和不确定性问题的数学工具。如何度量利用粗糙集
【学位授予单位】:中国铁道科学研究院
【学位级别】:博士
【学位授予年份】:2018
【分类号】:U293.22

【参考文献】

相关期刊论文 前10条

1 苏志达;祝跃飞;刘龙;;基于深度学习的安卓恶意应用检测[J];计算机应用;2017年06期

2 韦晓路;徐宽;;基于非相关发明专利文献的潜在知识关联分析研究述评[J];图书馆学研究;2015年10期

3 张钰莎;蒋盛益;;连续属性离散化算法研究综述[J];计算机应用与软件;2014年08期

4 李海霞;;基于可变精度粗糙集模型的有导师机器学习[J];东莞理工学院学报;2014年03期

5 李晓龙;张兆翔;王蕴红;刘庆杰;;深度学习在航拍场景分类中的应用[J];计算机科学与探索;2014年03期

6 何超;张玉峰;;基于语义关联分析的商务情报分析算法研究[J];情报杂志;2013年04期

7 张建华;祁力钧;冀荣华;王虎;黄士凯;王沛;;基于粗糙集和BP神经网络的棉花病害识别[J];农业工程学报;2012年07期

8 王翰钊;李景文;;基于神经网络知识发现的GIS决策支持系统[J];测绘与空间地理信息;2012年02期

9 李明;刘鲁;苗蕊;朱延秋;;基于贝叶斯信念网络的多案例库检索方法[J];北京工业大学学报;2012年01期

10 高爽;冬雷;高阳;廖晓钟;;基于粗糙集理论的中长期风速预测[J];中国电机工程学报;2012年01期



本文编号:2620460

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2620460.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9acca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com