面向大数据基于DEA和RBF/SVM的预测方法研究
发布时间:2021-10-21 19:17
在大数据时代,如何利用大数据进行有效分析已经成为各行各业关注的焦点。由于大数据的来源、数量、结构形式的不同、实时性等多样化的特点使其涵盖的价值很高,但其价值密度却很低。大数据集中存在的数据噪声和数据冗余会对数据分析产生不可估量的负面影响。此外,大数据集中还涵盖了多个变量之间的函数关系,可能会对数据分析结果产生一定的偏差。因此,在利用大数据进行分析研究之前首先要对大数据进行数据预处理,剔除冗余和无效数据。然而传统的大数据预处理方法并没有考虑变量之间的函数关系。数据包络分析(Data Envelopment Analysis,DEA)可以有效处理由变量之间函数关系引发的偏差问题。在利用DEA进行数据预处理的过程中,无需预知输入输出变量之间的函数关系、无需事先设定权重,通过求得的效率值筛选得到最有效的数据,剔除异常值和冗余值,在不改变数据质量的前提下缩减数据的数量,是一种可以应用于机器学习的数据预处理的有效方式。此外,常用的大数据建模工具不能有效地对包含复杂非线性关系的大数据进行建模。目前关于大数据建模比较好的方法有径向基函数(Radial-Basis Function,RBF)和支持向量机...
【文章来源】:南京邮电大学江苏省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
面向大数据的基于DEA和RBF/SVM的技术路线图
南京邮电大学硕士研究生学位论文第四章DEA-RBF和DEA-SVM的仿真研究图4.1Y1的预测值和真实值对比图4.2Y2的预测值和真实值对比根据图4.1和图4.2的预测结果图不难看出,除了个别点,总体来说利用DEA-RBF方法求出的预测值与其真实值之间相差不大,预测结果比较好。为了更加精确的对比结果,表4.2列出了26个测试单元输出的预测值和真实值之间的误差比较。误差率的公式如下:误差率=真实值预测值真实值100%,(4.2)25
南京邮电大学硕士研究生学位论文第四章DEA-RBF和DEA-SVM的仿真研究图4.1Y1的预测值和真实值对比图4.2Y2的预测值和真实值对比根据图4.1和图4.2的预测结果图不难看出,除了个别点,总体来说利用DEA-RBF方法求出的预测值与其真实值之间相差不大,预测结果比较好。为了更加精确的对比结果,表4.2列出了26个测试单元输出的预测值和真实值之间的误差比较。误差率的公式如下:误差率=真实值预测值真实值100%,(4.2)25
【参考文献】:
期刊论文
[1]烟草行业实验室安全文化评价模型[J]. 汪洪焦,窦滨,张其东,刘国愈,贾云祯,王燃. 中国烟草学报. 2020(02)
[2]基于DEA的中国高原训练资源配置效率评价研究[J]. 张俊珍. 西安体育学院学报. 2019(06)
[3]医改背景下基于DEA的医院科室运行效率评价[J]. 刘利,王楠,武爱文. 中国卫生统计. 2019(05)
[4]基于MRMR-HK-SVM模型的PM2.5浓度预测[J]. 李建新,刘小生,刘静,黄俊. 中国环境科学. 2019(06)
[5]基于SGA-RBF的协同过滤算法研究[J]. 王玉珍,许艳茹,常丹. 统计与决策. 2019(04)
[6]新电改背景下基于数据包络分析的电网投资有效性研究与应用[J]. 石蓉,李永毅,王开艳,张磊,贾嵘,郎锐. 电网与清洁能源. 2019(02)
[7]基于社会化媒体的公共政策舆情预测研究[J]. 王亚民,宁静,马续补. 情报理论与实践. 2019(01)
[8]量子粒子群BP神经网络在GNSS高程转换中的应用分析[J]. 韩红超. 测绘通报. 2019(01)
[9]时间序列预测方法综述[J]. 杨海民,潘志松,白玮. 计算机科学. 2019(01)
[10]基于短期风功率预测的数据预处理算法研究[J]. 许梦田,王洪哲,赵成萍,严华. 可再生能源. 2019(01)
博士论文
[1]大数据背景下煤矿安全管理效率分析及提升仿真研究[D]. 乔万冠.中国矿业大学 2019
[2]最小二乘支持向量机建模及预测控制算法研究[D]. 李丽娟.浙江大学 2008
硕士论文
[1]保障性住房项目绩效评价研究[D]. 曲传刚.西安建筑科技大学 2017
[2]A汽车4S店零部件需求预测研究[D]. 姜月娜.北京交通大学 2017
[3]南海岛礁风能资源及风力发电评价[D]. 蒋洁.南京大学 2016
[4]保障性住房项目绩效评价研究[D]. 邓洁.集美大学 2012
[5]保障性住房项目的质量管理体系研究[D]. 李玲.武汉理工大学 2011
[6]基于数据挖掘的葡萄酒质量识别[D]. 林翠香.中南大学 2010
[7]城市宜居性评价研究[D]. 李小英.兰州大学 2007
本文编号:3449573
【文章来源】:南京邮电大学江苏省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
面向大数据的基于DEA和RBF/SVM的技术路线图
南京邮电大学硕士研究生学位论文第四章DEA-RBF和DEA-SVM的仿真研究图4.1Y1的预测值和真实值对比图4.2Y2的预测值和真实值对比根据图4.1和图4.2的预测结果图不难看出,除了个别点,总体来说利用DEA-RBF方法求出的预测值与其真实值之间相差不大,预测结果比较好。为了更加精确的对比结果,表4.2列出了26个测试单元输出的预测值和真实值之间的误差比较。误差率的公式如下:误差率=真实值预测值真实值100%,(4.2)25
南京邮电大学硕士研究生学位论文第四章DEA-RBF和DEA-SVM的仿真研究图4.1Y1的预测值和真实值对比图4.2Y2的预测值和真实值对比根据图4.1和图4.2的预测结果图不难看出,除了个别点,总体来说利用DEA-RBF方法求出的预测值与其真实值之间相差不大,预测结果比较好。为了更加精确的对比结果,表4.2列出了26个测试单元输出的预测值和真实值之间的误差比较。误差率的公式如下:误差率=真实值预测值真实值100%,(4.2)25
【参考文献】:
期刊论文
[1]烟草行业实验室安全文化评价模型[J]. 汪洪焦,窦滨,张其东,刘国愈,贾云祯,王燃. 中国烟草学报. 2020(02)
[2]基于DEA的中国高原训练资源配置效率评价研究[J]. 张俊珍. 西安体育学院学报. 2019(06)
[3]医改背景下基于DEA的医院科室运行效率评价[J]. 刘利,王楠,武爱文. 中国卫生统计. 2019(05)
[4]基于MRMR-HK-SVM模型的PM2.5浓度预测[J]. 李建新,刘小生,刘静,黄俊. 中国环境科学. 2019(06)
[5]基于SGA-RBF的协同过滤算法研究[J]. 王玉珍,许艳茹,常丹. 统计与决策. 2019(04)
[6]新电改背景下基于数据包络分析的电网投资有效性研究与应用[J]. 石蓉,李永毅,王开艳,张磊,贾嵘,郎锐. 电网与清洁能源. 2019(02)
[7]基于社会化媒体的公共政策舆情预测研究[J]. 王亚民,宁静,马续补. 情报理论与实践. 2019(01)
[8]量子粒子群BP神经网络在GNSS高程转换中的应用分析[J]. 韩红超. 测绘通报. 2019(01)
[9]时间序列预测方法综述[J]. 杨海民,潘志松,白玮. 计算机科学. 2019(01)
[10]基于短期风功率预测的数据预处理算法研究[J]. 许梦田,王洪哲,赵成萍,严华. 可再生能源. 2019(01)
博士论文
[1]大数据背景下煤矿安全管理效率分析及提升仿真研究[D]. 乔万冠.中国矿业大学 2019
[2]最小二乘支持向量机建模及预测控制算法研究[D]. 李丽娟.浙江大学 2008
硕士论文
[1]保障性住房项目绩效评价研究[D]. 曲传刚.西安建筑科技大学 2017
[2]A汽车4S店零部件需求预测研究[D]. 姜月娜.北京交通大学 2017
[3]南海岛礁风能资源及风力发电评价[D]. 蒋洁.南京大学 2016
[4]保障性住房项目绩效评价研究[D]. 邓洁.集美大学 2012
[5]保障性住房项目的质量管理体系研究[D]. 李玲.武汉理工大学 2011
[6]基于数据挖掘的葡萄酒质量识别[D]. 林翠香.中南大学 2010
[7]城市宜居性评价研究[D]. 李小英.兰州大学 2007
本文编号:3449573
本文链接:https://www.wllwen.com/projectlw/qgylw/3449573.html