不完整数据分类算法及其在建筑能耗预测中的应用
发布时间:2021-04-06 00:10
针对不完整数据,已经发展出很多预处理方法,如删除法和填补法,删除法会造成信息浪费,填补法会带来不确定,因此不完整数据分类成为了研究重点。建筑能耗预测从宏观上分析建筑能耗变化,对建设环境友好型社会具有长远的意义。在建筑能耗预测中,各种数据丢失使传统方法很难适用,不完整数据分类及其在建筑能耗预测中的应用具有重要的研究意义。本文围绕这一问题开展不完整数据分类及其在建筑能耗预测中的应用研究。针对不完整数据分类问题,提出两种不完整数据分类算法,并对算法效果进行验证;在所提算法基础上,应用在建筑能耗预测,验证算法应用的可行性。具体研究内容如下:(1)提出基于D-S证据理论的不完整数据混合分类算法。将聚类与分类算法结合,对完整样本聚类并选择训练集,并根据剩余样本现有属性,构建多个训练集训练相应分类器;在D-S证据理论下将部分样本划分到复合类中,并对复合类中的不完整样本估计、分类、融合得到最终分类结果。该算法能够在有效表征不精确样本并降低误分率。(2)提出基于属性的不完整数据分类算法。将不完整数据集划分得到多个数据子集,每一个数据子集训练一个分类器并计算分类器权重;将属性相似度和属性权重综合对测试集中...
【文章来源】:西安建筑科技大学陕西省
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
西安建筑科技大学硕士学位论文17图3.1类中心距离较近下取值示例图3.2类中心距离较远下取值示例数据集X中的剩余样本被划分到测试集中,测试集由剩余的完整样本(不可靠样本)和全部的不完整样本两部分组成。3.1.2分类剩余样本并表征不精确样本利用上一小节中得到的训练集训练多个分类器来对剩余样本进行分类,剩余样本由两部分组成:完整样本数据集completeX中的不可靠样本和不完整样本集missingX中的样本。对样本分类的过程,首先根据样本ix的现有属性,对上一小节得到训练集进行处理,然后使用处理后的训练集训练基础分类器并对样本ix进行分类。将上述步骤重复直到所有剩余样本分类完毕。举例说明以上步骤,假设一个有三个属性的不完整样本12[,,?]iiix=xx,其中第三个属性i3x缺失,训练基础分类器所使用的训练集将只有训练集中所有样本的前两个属性,即j1x和j2x,trainingXjx。通过以上步骤可知,在HCA算法中,测试集中的每一个样本都会使用一个由完整属性训练集训练得到的分类器进行分类,但在极端情况下,测试集中的每一个样本都需要训练一个相应的基础分类器。若数据集中不完整数据较少且数据缺失的属
西安建筑科技大学硕士学位论文17图3.1类中心距离较近下取值示例图3.2类中心距离较远下取值示例数据集X中的剩余样本被划分到测试集中,测试集由剩余的完整样本(不可靠样本)和全部的不完整样本两部分组成。3.1.2分类剩余样本并表征不精确样本利用上一小节中得到的训练集训练多个分类器来对剩余样本进行分类,剩余样本由两部分组成:完整样本数据集completeX中的不可靠样本和不完整样本集missingX中的样本。对样本分类的过程,首先根据样本ix的现有属性,对上一小节得到训练集进行处理,然后使用处理后的训练集训练基础分类器并对样本ix进行分类。将上述步骤重复直到所有剩余样本分类完毕。举例说明以上步骤,假设一个有三个属性的不完整样本12[,,?]iiix=xx,其中第三个属性i3x缺失,训练基础分类器所使用的训练集将只有训练集中所有样本的前两个属性,即j1x和j2x,trainingXjx。通过以上步骤可知,在HCA算法中,测试集中的每一个样本都会使用一个由完整属性训练集训练得到的分类器进行分类,但在极端情况下,测试集中的每一个样本都需要训练一个相应的基础分类器。若数据集中不完整数据较少且数据缺失的属
【参考文献】:
期刊论文
[1]完全贝叶斯分类器在经济数据分类中的应用[J]. 王辉,李玉亮,王莉. 东北师大学报(自然科学版). 2019(04)
[2]常用多重插补法的插补重数选择[J]. 孙玲莉,董世杰,杨贵军. 统计与决策. 2019(23)
[3]缺失数据的处理方法及其发展趋势[J]. 邓建新,单路宝,贺德强,唐锐. 统计与决策. 2019(23)
[4]支持隐私保护的k近邻分类器[J]. 徐剑,王安迪,毕猛,周福才. 软件学报. 2019(11)
[5]LKNNI:一种局部K近邻插补算法[J]. 杨日东,李琳,陈秋源,周毅. 中国卫生统计. 2019(05)
[6]基于EnergyPlus与CFD耦合的大空间建筑能耗分析[J]. 李展,卢纪富,李杨,曹守平,李志彬. 建筑节能. 2019(08)
[7]基于EnergyPlus的沈阳典型单体建筑间歇供暖策略设计研究[J]. 贾永英,崔雪,王忠华. 建筑节能. 2019(08)
[8]基于机器学习的住宅能耗预测[J]. 程亚豪,陈焕新,王江宇. 制冷与空调. 2019(05)
[9]基于PSO-LS-SVMR的公共建筑能耗短期预测模型[J]. 邓晓红,宫磊,刘兴民. 建筑节能. 2019(04)
[10]基于BP神经网络的公共建筑用电能耗预测研究[J]. 李嘉玲,蒋艳. 软件导刊. 2019(07)
硕士论文
[1]数据驱动的建筑使用能耗预测及其应用研究[D]. 周惟.苏州科技大学 2019
[2]基于混合数据驱动模型的多尺度电力能耗预测方法研究[D]. 谢先明.江苏大学 2019
[3]基于数据挖掘的公共建筑能耗预测与能效管理[D]. 崔冲.山东建筑大学 2017
[4]用度日法分析气候变化对建筑采暖能耗的影响[D]. 侯政.西安建筑科技大学 2007
本文编号:3120365
【文章来源】:西安建筑科技大学陕西省
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
西安建筑科技大学硕士学位论文17图3.1类中心距离较近下取值示例图3.2类中心距离较远下取值示例数据集X中的剩余样本被划分到测试集中,测试集由剩余的完整样本(不可靠样本)和全部的不完整样本两部分组成。3.1.2分类剩余样本并表征不精确样本利用上一小节中得到的训练集训练多个分类器来对剩余样本进行分类,剩余样本由两部分组成:完整样本数据集completeX中的不可靠样本和不完整样本集missingX中的样本。对样本分类的过程,首先根据样本ix的现有属性,对上一小节得到训练集进行处理,然后使用处理后的训练集训练基础分类器并对样本ix进行分类。将上述步骤重复直到所有剩余样本分类完毕。举例说明以上步骤,假设一个有三个属性的不完整样本12[,,?]iiix=xx,其中第三个属性i3x缺失,训练基础分类器所使用的训练集将只有训练集中所有样本的前两个属性,即j1x和j2x,trainingXjx。通过以上步骤可知,在HCA算法中,测试集中的每一个样本都会使用一个由完整属性训练集训练得到的分类器进行分类,但在极端情况下,测试集中的每一个样本都需要训练一个相应的基础分类器。若数据集中不完整数据较少且数据缺失的属
西安建筑科技大学硕士学位论文17图3.1类中心距离较近下取值示例图3.2类中心距离较远下取值示例数据集X中的剩余样本被划分到测试集中,测试集由剩余的完整样本(不可靠样本)和全部的不完整样本两部分组成。3.1.2分类剩余样本并表征不精确样本利用上一小节中得到的训练集训练多个分类器来对剩余样本进行分类,剩余样本由两部分组成:完整样本数据集completeX中的不可靠样本和不完整样本集missingX中的样本。对样本分类的过程,首先根据样本ix的现有属性,对上一小节得到训练集进行处理,然后使用处理后的训练集训练基础分类器并对样本ix进行分类。将上述步骤重复直到所有剩余样本分类完毕。举例说明以上步骤,假设一个有三个属性的不完整样本12[,,?]iiix=xx,其中第三个属性i3x缺失,训练基础分类器所使用的训练集将只有训练集中所有样本的前两个属性,即j1x和j2x,trainingXjx。通过以上步骤可知,在HCA算法中,测试集中的每一个样本都会使用一个由完整属性训练集训练得到的分类器进行分类,但在极端情况下,测试集中的每一个样本都需要训练一个相应的基础分类器。若数据集中不完整数据较少且数据缺失的属
【参考文献】:
期刊论文
[1]完全贝叶斯分类器在经济数据分类中的应用[J]. 王辉,李玉亮,王莉. 东北师大学报(自然科学版). 2019(04)
[2]常用多重插补法的插补重数选择[J]. 孙玲莉,董世杰,杨贵军. 统计与决策. 2019(23)
[3]缺失数据的处理方法及其发展趋势[J]. 邓建新,单路宝,贺德强,唐锐. 统计与决策. 2019(23)
[4]支持隐私保护的k近邻分类器[J]. 徐剑,王安迪,毕猛,周福才. 软件学报. 2019(11)
[5]LKNNI:一种局部K近邻插补算法[J]. 杨日东,李琳,陈秋源,周毅. 中国卫生统计. 2019(05)
[6]基于EnergyPlus与CFD耦合的大空间建筑能耗分析[J]. 李展,卢纪富,李杨,曹守平,李志彬. 建筑节能. 2019(08)
[7]基于EnergyPlus的沈阳典型单体建筑间歇供暖策略设计研究[J]. 贾永英,崔雪,王忠华. 建筑节能. 2019(08)
[8]基于机器学习的住宅能耗预测[J]. 程亚豪,陈焕新,王江宇. 制冷与空调. 2019(05)
[9]基于PSO-LS-SVMR的公共建筑能耗短期预测模型[J]. 邓晓红,宫磊,刘兴民. 建筑节能. 2019(04)
[10]基于BP神经网络的公共建筑用电能耗预测研究[J]. 李嘉玲,蒋艳. 软件导刊. 2019(07)
硕士论文
[1]数据驱动的建筑使用能耗预测及其应用研究[D]. 周惟.苏州科技大学 2019
[2]基于混合数据驱动模型的多尺度电力能耗预测方法研究[D]. 谢先明.江苏大学 2019
[3]基于数据挖掘的公共建筑能耗预测与能效管理[D]. 崔冲.山东建筑大学 2017
[4]用度日法分析气候变化对建筑采暖能耗的影响[D]. 侯政.西安建筑科技大学 2007
本文编号:3120365
本文链接:https://www.wllwen.com/jianzhugongchenglunwen/3120365.html