大数据背景下基于可信性的预测方法研究
发布时间:2021-01-01 22:49
基于数据的预测是当今学术和应用领域广泛关注的研究内容,很多学者提出的数据挖掘方法在一定程度上解决了预测的问题,但目前从理论上处理大数据的系统化方法还不完善。因此,本文针对大数据的数据量大的特点做了以下两方面工作:1)以具有结构特征的大数据为背景,研究了基于决策树的有放回抽样与无放回抽样相结合的分类规则获取方法(简记为SDTI)。该研究包括初始分类规则库筛选机制、分类规则库可精炼策略以及基于有放回抽样的分类规则的可信性确定方法,并结合理论与实验结果分析了该方法的可行性与可解释性,为大数据背景下的分类规则获取方法提供了理论和方法支撑。2)以具有结构特征的大数据为背景,研究了基于可信性的不确定性预测方法(简记为RDP)。该研究包括RDP的执行机制与可信性的确定方法,并结合大数定律以及实验结果分析了决策属性取值分布的逼近问题,表明RDP具有良好的可解释性和可操作性,可以为大数据背景下的预测提供理论和方法支撑。因而,本文提出的模型均具有良好的可解释性和结构特征,可以帮助管理者在数据量很多的不确定环境下做出合理的决策。
【文章来源】:河北科技大学河北省
【文章页数】:56 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状与应用前景
1.2.1 预测方法的研究现状
1.2.2 决策树的研究现状
1.2.3 大数据背景下决策树分类预测方法的研究现状
1.3 问题的提出
1.4 论文的研究内容
1.5 论文结构
第2章 预备知识
2.1 决策树基本概念
2.1.1 决策树简介
2.1.2 决策树算法基本步骤
2.1.3 决策树的评价指标
2.2 数理统计相关知识
2.3 本章小结
第3章 大数据背景下基于抽样的分类规则获取方法
3.1 分类规则的形式化描述
3.2 基于抽样的分类规则获取机制
3.2.1 基于可信阈值的分类规则筛选策略
3.2.2 分类规则筛选的实例解释
3.3 抽样背景下分类规则的可信性收敛特征
3.4 STDI的仿真实验
3.4.1 SDTI的测试可信性仿真分析
3.4.2 SDTI的分类性能仿真分析
3.4.3 SDTI的稳定性分析
3.5 本章小结
第4章 基于可信性分布的不确定性预测方法研究
4.1 预备知识
4.2 抽样条件下的预测方法执行机制
4.2.1 RDP执行机制
4.2.2 RDP的实例解释
4.3 抽样背景下可信性分布的收敛特征分析
4.4 RDP仿真实验
4.4.1 可信性分布的性能仿真
4.4.2 RDP的稳定性
4.5 本章小结
结论
参考文献
攻读硕士学位期间所发表的论文
致谢
【参考文献】:
期刊论文
[1]基于改进K-modes聚类的KNN分类算法[J]. 王志华,刘绍廷,罗齐. 计算机工程与设计. 2019(08)
[2]基于遗传算法的多工序多机器调度优化研究[J]. 周福来. 软件. 2019(06)
[3]KNN认知诊断法及其应用[J]. 康春花,张淑君,李元白,曾平飞. 江西师范大学学报(自然科学版). 2019(02)
[4]基于风险排名和决策树的民航反恐安保风险评估与决策分析研究[J]. 冯文刚,李岩,李福海,王欣,周西平. 数据分析与知识发现. 2018(10)
[5]基于数据挖掘技术的机械设备故障诊断应用研究[J]. 徐红霞. 电脑知识与技术. 2018(30)
[6]基于梯度提升决策树的高速公路交织区汇入位置模型[J]. 李根,孙璐. 交通运输系统工程与信息. 2018(03)
[7]基于遗传算法的PID控制参数研究分析[J]. 刘亚洲,齐言强,张志毅. 新技术新工艺. 2018(03)
[8]面向分布式数据流大数据分类的多变量决策树[J]. 张宇,包研科,邵良杉,刘威. 自动化学报. 2018(06)
[9]基于改进随机决策树算法的分布式数据挖掘[J]. 石红姣. 计算机与数字工程. 2017(09)
[10]大数据环境下决策树算法并行化研究[J]. 李运娣. 河南工程学院学报(自然科学版). 2017(02)
博士论文
[1]分布式决策树算法在分类问题中的研究与实现[D]. 母亚双.大连理工大学 2018
[2]几个预测方法及模型的研究[D]. 唐万梅.内蒙古大学 2006
硕士论文
[1]基于大数据平台的决策树分类算法及并行化研究[D]. 张永潘.南京邮电大学 2017
[2]非平衡大数据应用领域的多决策树及其分布式计算理论研究[D]. 张翕茜.太原理工大学 2017
本文编号:2952132
【文章来源】:河北科技大学河北省
【文章页数】:56 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状与应用前景
1.2.1 预测方法的研究现状
1.2.2 决策树的研究现状
1.2.3 大数据背景下决策树分类预测方法的研究现状
1.3 问题的提出
1.4 论文的研究内容
1.5 论文结构
第2章 预备知识
2.1 决策树基本概念
2.1.1 决策树简介
2.1.2 决策树算法基本步骤
2.1.3 决策树的评价指标
2.2 数理统计相关知识
2.3 本章小结
第3章 大数据背景下基于抽样的分类规则获取方法
3.1 分类规则的形式化描述
3.2 基于抽样的分类规则获取机制
3.2.1 基于可信阈值的分类规则筛选策略
3.2.2 分类规则筛选的实例解释
3.3 抽样背景下分类规则的可信性收敛特征
3.4 STDI的仿真实验
3.4.1 SDTI的测试可信性仿真分析
3.4.2 SDTI的分类性能仿真分析
3.4.3 SDTI的稳定性分析
3.5 本章小结
第4章 基于可信性分布的不确定性预测方法研究
4.1 预备知识
4.2 抽样条件下的预测方法执行机制
4.2.1 RDP执行机制
4.2.2 RDP的实例解释
4.3 抽样背景下可信性分布的收敛特征分析
4.4 RDP仿真实验
4.4.1 可信性分布的性能仿真
4.4.2 RDP的稳定性
4.5 本章小结
结论
参考文献
攻读硕士学位期间所发表的论文
致谢
【参考文献】:
期刊论文
[1]基于改进K-modes聚类的KNN分类算法[J]. 王志华,刘绍廷,罗齐. 计算机工程与设计. 2019(08)
[2]基于遗传算法的多工序多机器调度优化研究[J]. 周福来. 软件. 2019(06)
[3]KNN认知诊断法及其应用[J]. 康春花,张淑君,李元白,曾平飞. 江西师范大学学报(自然科学版). 2019(02)
[4]基于风险排名和决策树的民航反恐安保风险评估与决策分析研究[J]. 冯文刚,李岩,李福海,王欣,周西平. 数据分析与知识发现. 2018(10)
[5]基于数据挖掘技术的机械设备故障诊断应用研究[J]. 徐红霞. 电脑知识与技术. 2018(30)
[6]基于梯度提升决策树的高速公路交织区汇入位置模型[J]. 李根,孙璐. 交通运输系统工程与信息. 2018(03)
[7]基于遗传算法的PID控制参数研究分析[J]. 刘亚洲,齐言强,张志毅. 新技术新工艺. 2018(03)
[8]面向分布式数据流大数据分类的多变量决策树[J]. 张宇,包研科,邵良杉,刘威. 自动化学报. 2018(06)
[9]基于改进随机决策树算法的分布式数据挖掘[J]. 石红姣. 计算机与数字工程. 2017(09)
[10]大数据环境下决策树算法并行化研究[J]. 李运娣. 河南工程学院学报(自然科学版). 2017(02)
博士论文
[1]分布式决策树算法在分类问题中的研究与实现[D]. 母亚双.大连理工大学 2018
[2]几个预测方法及模型的研究[D]. 唐万梅.内蒙古大学 2006
硕士论文
[1]基于大数据平台的决策树分类算法及并行化研究[D]. 张永潘.南京邮电大学 2017
[2]非平衡大数据应用领域的多决策树及其分布式计算理论研究[D]. 张翕茜.太原理工大学 2017
本文编号:2952132
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2952132.html