区间值数据的概率处理方法
发布时间:2017-07-15 17:08
本文关键词:区间值数据的概率处理方法
【摘要】:随着计算机和互联网技术的高速发展,人们采集和处理的数据格式越来越丰富。对于常见的实数数据已有大量研究工作,而相对来说区间值数据的研究比较少。区间值数据在多变量分析,模式识别,数据挖掘,控制等多领域有着广泛的应用。区间值数据与实数数据不同的地方在于用一个区间范围表示一个特征值,而不是一个精确值,这决定了其本身包含不确定性。因此,与实数数据相比,区间值数据需要特殊的处理。随机事件在自然界广泛存在。区间值数据的一大来源也是源于未观察到的随机变量。概率论是一门比较成熟的学科,有大量的技术和理论支持,也适用于对不确定性进行建模。因此,本文从区间值数据本身的不确定性特点出发,尝试用概率模型对区间值进行处理,解释了概率模型对应的现实基础,并改造和提出了一些适用于区间值的差异性度量和回归,聚类算法。本文的研究成果主要如下:1).给出了两个例子说明用概率模型处理区间值的合理性。把区间映射到一定的分布函数上,并在其基础上定义了3个差异性度量,证明了它们的一些性质。2).在概率模型基础上,结合区间值不确定性的特点,提出了应用于区间值数据的回归算法,包括:多变量线性回归和核回归算法。3).基于新的聚类目标函数,提出了一种新的应用于区间值数据的聚类算法,此算法同样也适用于实数数据,并且证明了算法的收敛性。
【关键词】:区间值数据 概率 差异性度量 回归 聚类
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;O212.1
【目录】:
- 摘要4-5
- Abstract5-10
- 第1章 绪论10-14
- 1.1 区间值信息系统的研究背景10-12
- 1.2 本文的主要内容12-14
- 1.2.1 本文的主要研究内容12-13
- 1.2.2 本文结构安排13-14
- 第2章 区间值数据相关技术综述14-19
- 2.1 区间值差异性度量14-15
- 2.2 区间值聚类算法15-16
- 2.3 区间值PCA算法16-17
- 2.4 区间值特征选择17-18
- 2.5 本章小结18-19
- 第3章 区间值数据的概率模型19-26
- 3.1 区间值概率解释的例子19-21
- 3.2 两个常用的分布21-22
- 3.3 区间值数据差异性度量22-23
- 3.4 基于概率模型的区间值差异性度量23-25
- 3.5 本章小结25-26
- 第4章 区间值数据多变量回归26-33
- 4.1 线性回归简介26-27
- 4.2 区间值线性回归模型27-29
- 4.2.1 权回归27-28
- 4.2.2 带惩罚回归28-29
- 4.2.3 随机期望回归29
- 4.3 核回归29-30
- 4.4 区间值核回归算法30-32
- 4.5 本章小结32-33
- 第5章 区间数据聚类33-42
- 5.1 聚类简介33-34
- 5.2 bucketKmeans算法34-41
- 5.2.1 概率密度估计34-36
- 5.2.2 区间值直方图估计36
- 5.2.3 bucketKmeans36-39
- 5.2.4 bucketKmeans收敛性证明39-41
- 5.3 本章小结41-42
- 第6章 实验结果与分析42-56
- 6.1 区间值回归算法实验结果42-48
- 6.2 区间值聚类实验结果48-54
- 6.3 本章小结54-56
- 第7章 总结与展望56-58
- 7.1 总结56
- 7.2 展望56-58
- 参考文献58-62
- 附录62-64
- 致谢64
【参考文献】
中国期刊全文数据库 前2条
1 徐泽水,达庆利;区间型多属性决策的一种新方法[J];东南大学学报(自然科学版);2003年04期
2 徐泽水;;区间直觉模糊信息的集成方法及其在决策中的应用[J];控制与决策;2007年02期
,本文编号:544864
本文链接:https://www.wllwen.com/kejilunwen/yysx/544864.html