物联网能耗数据智能分析及其应用平台设计
发布时间:2017-10-22 04:29
本文关键词:物联网能耗数据智能分析及其应用平台设计
更多相关文章: 数据挖掘 关联规则 密度聚类 近邻传播算法 物联网 建筑能耗
【摘要】:随着数据信息时代的迅速到来,建筑能耗也受到了人们的极大关注,能耗数据以其多样化的形式开始呈现急剧增长的趋势,对于海量能耗数据的分析研究显得越来越重要。由于数据挖掘可以对海量数据进行分析,帮助用户更好地发现数据中隐含的有用信息。本文提出运用数据挖掘技术对建筑能耗数据分析,设计物联网能耗数据智能分析系统验证数据挖掘理论研究的可行性,研究的主要内容如下:首先,关联规则数据挖掘理论可以从大量数据的项集中发现有用的规则,建筑用电能耗分项、建筑房间面积和房间人员等属性之间的变化是存在某种关联或者关系的。Apriori关联规则挖掘算法是关联规则理论中最具有典型性的方法,但在它计算频繁项集时需要生成大量的候选项集,并且需要多次扫描数据库,增加了算法的计算复杂度,由于排序索引规则通过索引编号,跳跃搜索项集,可以有效加快信息的检索速率,提出一种基于布尔矩阵和排序索引规则的关联规则挖掘算法,先扫描数据集获取布尔矩阵,再对布尔矩阵进行预处理操作,删除其中无用事务和项集,根据剪枝布尔矩阵和标记序列产生频繁二项集,结合排序索引生成其他频繁项集,有效提高了频繁项集挖掘的效率,并有效减少了内存的占用率。其次,由于聚类挖掘技术作为数据挖掘领域中的一种工具,可以获得数据分布的内在规律,通过聚类数据挖掘方法对数据中心内部设备中的能耗数据进行聚类分析,可以发现异常耗能设备以及根据聚类分析制定合理的用电方案。由于基于密度的聚类方法可以有效发现任意形状的簇和有效识别离群点,可以有效利用密度聚类这一特点发现建筑能耗的内部规则,但在全局参数选择上DBSCAN密度聚类算法需人工干预以及区域查询方式过程复杂和查询易丢失对象等不足,提出一种改进的参数自适应以及区域快速查询的密度聚类算法,有效提高聚类的效率。基于划分的近邻传播聚类算法利用最近邻居关系传递特性,无需初始化聚类中心,可以在比较短的时间内发现更低误差的聚类结果,对处理数据量庞大的能耗数据具有很好的可行性。但在无先验知识条件下存在偏向参数选择困难以及在处理结构复杂或高维数据的数据信息重叠问题,提出基于流形结构邻域选择的局部投影近邻传播算法,在保留数据内部非线性结构的前提下,有效删除高位复杂数据空间中的冗余数据。最后,设计实现物联网建筑能耗数据智能分析系统,以验证提出的关联规则和聚类数据挖掘理论研究的可行性。系统由中心服务器和客户端两部分组成。中心服务器负责实现数据采集、数据挖掘、数据分析、数据存储及数据通信接口等功能,客户端根据restful接口获取服务器端的数据分析结果和能耗数据,实现数据通信、数据解析以及数据可视化等功能,方便管理者监管建筑能耗使用情况,辅助管理者制定节能方案,有效实现对建筑能耗数据的节能目的。
【关键词】:数据挖掘 关联规则 密度聚类 近邻传播算法 物联网 建筑能耗
【学位授予单位】:江南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;TP391.44;TN929.5
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-16
- 1.1 本文选题背景及研究意义8
- 1.2 国内外研究现状8-14
- 1.2.1 数据挖掘技术概述8-9
- 1.2.2 建筑能耗分析国内外研究现状9-11
- 1.2.3 关联规则数据挖掘技术概述11-12
- 1.2.4 聚类数据挖掘技术概述12-14
- 1.3 本文主要工作内容与组织结构14-16
- 第二章 矩阵排序索引关联规则数据挖掘方法16-27
- 2.1 公共建筑能耗知识及仿真数据选择16-17
- 2.2 关联规则相关概念17-18
- 2.3 布尔矩阵频繁项集生成18-20
- 2.3.1 布尔矩阵生成18-19
- 2.3.2 布尔矩阵剪枝方法19-20
- 2.3.3 上三角矩阵频繁项集生成20
- 2.4 排序索引频繁项集生成20-22
- 2.5 效率分析22
- 2.6 实验结果与分析22-26
- 2.7 本章小结26-27
- 第三章 自适应快速DBSCAN密度聚类方法27-36
- 3.1 DBSCAN密度聚类算法原理27-28
- 3.2 扫描半径参数的多项式数据拟合方法28-31
- 3.2.1 距离分布矩阵28
- 3.2.2 KNN数据分布与distk概率分布28-29
- 3.2.3 曲线拟合29-31
- 3.3 种子代表对象的选择31-32
- 3.4 外部评价标准32
- 3.5 实验结果与分析32-35
- 3.6 本章小结35-36
- 第四章 基于流形结构邻域选择的局部投影近邻传播算法36-45
- 4.1 AP聚类算法原理36-37
- 4.2 基于流形结构邻域选择的LPP数据投影近邻传播算法37-41
- 4.2.1 偏向参数自适应确定38
- 4.2.2 基于流形结构邻域选择的LPP数据投影方法38-41
- 4.3 内部评价标准41
- 4.4 实验结果与分析41-44
- 4.5 本章小结44-45
- 第五章 物联网建筑能耗数据智能分析系统45-63
- 5.1 系统总体技术架构45-48
- 5.2 功能模块设计48-49
- 5.3 系统界面设计49-52
- 5.4 实验结果与分析52-62
- 5.4.1 建筑能耗数据来源52
- 5.4.2 建筑能耗数据预处理52
- 5.4.3 IMSIA关联规则数据挖掘模型52-56
- 5.4.4 AF-DBSCAN聚类数据挖掘模型56-58
- 5.4.5 数据分析模型58-62
- 5.5 本章小结62-63
- 第六章 主要结论与展望63-65
- 主要结论63-64
- 展望64-65
- 致谢65-66
- 参考文献66-71
- 附录: 作者在攻读硕士学位期间发表的论文71
【参考文献】
中国期刊全文数据库 前3条
1 毛宇星;施伯乐;;基于扩展自然序树的概化关联规则增量挖掘方法[J];计算机研究与发展;2012年03期
2 张建朋;陈福才;李邵梅;刘力雄;;基于密度与近邻传播的数据流聚类算法[J];自动化学报;2014年02期
3 岳士弘,李平,郭继东,周水庚;A statistical information-based clustering approach in distance space[J];Journal of Zhejiang University Science A(Science in Engineering);2005年01期
,本文编号:1076790
本文链接:https://www.wllwen.com/kejilunwen/wltx/1076790.html