基于K-means算法的高维用电数据聚类分析与可视化研究
发布时间:2021-09-29 22:48
随着智能电网技术的飞速发展,国家全面实施可再生资源政策,社会各个领域对电力的需求不断增长,电力能源系统正逐步转变得更加智能、更加灵活、更具有互动性。智能电网运行的各个环节中都会产生体积量巨大、结构性复杂且彼此间存在着复杂关联性的高维数据。挖掘出在高维用电数据中有价值的信息并进行可视化分析具有重要意义。本文在国内外学者的研究基础上,针对高维用电数据的K-means聚类算法和可视化展开了研究,本文的主要研究工作阐述如下:1.关于改进K-means算法中如何确定K值和如何选择初始聚类中心这两个问题,针对现有的高维用电数据集的特征,提出了一种改进的K-means算法。这种改进的算法是利用降维算法在3D视觉空间中降低高维特征空间中的数据集维度,结合Canopy算法来确定改进K-means算法的K值。在Canopy算法中引入样本密度参数,以此选取初始聚类中心。最终以智慧校园中智能电表采集到的学生用户高维用电数据集为基础进行实验。实验结果表明改进的K-means算法具有较高的聚类准确率,较强的抗噪声干扰能力以及较优的聚类效果。2.因维度过高影响传统Radviz可视化展示的问题,提出一种改进的可视化技...
【文章来源】:重庆邮电大学重庆市
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
Tableau支持的数据库
重庆邮电大学硕士学位论文第2章相关理论基础18数据领域中的像Hive、SparkSQL等分布式数据库。Tableau支持的数据库如图2.6所示。图2.6Tableau支持的数据库图2.7TableauDesktop首页各功能注释本文制作可视化平台使用的是Tableau下的TableauDesktop产品,在TableauDesktop上进行视图制作,图2.7为TableauDesktop的首页各功能注释。鉴于智能电网数据在智能电力系统的具体应用场景越来越多,有必要将Tableau应用在高维用电数据的综合分析中,为智能电网持续发展提供有效支撑。
重庆邮电大学硕士学位论文第3章基于降维的密度Canopy-K-means改进算法324.对比分析实验将本章提出的基于降维的密度Canopy-K-means算法对学校宿舍的用电信息进行仿真实验,分别选取该学校5600间宿舍在2017年的月用电高维数据作为数据源。①抗噪声性能验证改进聚类算法的抗噪声性能采用的是加入人工噪声的仿真实验,在数据特征集中分别加入噪声,噪声比例分别为0%、10%、20%、30%,噪声数据集服从X~N(,2)的正态分布,2,0.5。图3.7为宿舍用户的用电特征集降维效果图。从实验结果图中可以看出,加入不同比例噪声并没有降低PCA算法的降维效果。由图3.7可知,随着噪声比例加大,宿舍用电数据特征集中的簇内样本点渐渐分散。当噪声比例为30%时,从图3.7(d)三维图可以看到,靠近左边的两个簇内样本点分布在簇周围,成散落的状态,而靠近右边的两个簇有逐渐合拢的趋势,但是还能分明簇与簇之间的分界线,所以,实验表明,不管噪声为多少,用电数据特征集在三维特征空间中的样本点都被分为四簇,所以该算法的最佳聚类数K为4,宿舍也被分为四种类型。(a)0%(b)10%(c)20%(d)30%图3.7加入噪声的用电特征集降维效果图
本文编号:3414614
【文章来源】:重庆邮电大学重庆市
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
Tableau支持的数据库
重庆邮电大学硕士学位论文第2章相关理论基础18数据领域中的像Hive、SparkSQL等分布式数据库。Tableau支持的数据库如图2.6所示。图2.6Tableau支持的数据库图2.7TableauDesktop首页各功能注释本文制作可视化平台使用的是Tableau下的TableauDesktop产品,在TableauDesktop上进行视图制作,图2.7为TableauDesktop的首页各功能注释。鉴于智能电网数据在智能电力系统的具体应用场景越来越多,有必要将Tableau应用在高维用电数据的综合分析中,为智能电网持续发展提供有效支撑。
重庆邮电大学硕士学位论文第3章基于降维的密度Canopy-K-means改进算法324.对比分析实验将本章提出的基于降维的密度Canopy-K-means算法对学校宿舍的用电信息进行仿真实验,分别选取该学校5600间宿舍在2017年的月用电高维数据作为数据源。①抗噪声性能验证改进聚类算法的抗噪声性能采用的是加入人工噪声的仿真实验,在数据特征集中分别加入噪声,噪声比例分别为0%、10%、20%、30%,噪声数据集服从X~N(,2)的正态分布,2,0.5。图3.7为宿舍用户的用电特征集降维效果图。从实验结果图中可以看出,加入不同比例噪声并没有降低PCA算法的降维效果。由图3.7可知,随着噪声比例加大,宿舍用电数据特征集中的簇内样本点渐渐分散。当噪声比例为30%时,从图3.7(d)三维图可以看到,靠近左边的两个簇内样本点分布在簇周围,成散落的状态,而靠近右边的两个簇有逐渐合拢的趋势,但是还能分明簇与簇之间的分界线,所以,实验表明,不管噪声为多少,用电数据特征集在三维特征空间中的样本点都被分为四簇,所以该算法的最佳聚类数K为4,宿舍也被分为四种类型。(a)0%(b)10%(c)20%(d)30%图3.7加入噪声的用电特征集降维效果图
本文编号:3414614
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3414614.html
最近更新
教材专著