高维数据的近似粒度特征选择和分类方法研究
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
图2.2局部敏感哈算法的一个例子??Fig.?2.2?An?example?of?a?locally?sensitive?hash?algorithm??
题。??2.2局部敏感哈希算法理论??本节,将介绍局部敏感哈希算法(又称为LSH函数)的基本理论和方法。理论上,??局部敏感哈希算法应该拥有这样的性质:样本的相似程度越高,就有更高的概率被划分??到一个桶中。如果两个样本数据,在相同的LSH函数映射下被划分到相同的楠中,则??称两....
图3.1?LSH算法映射的结果??Fig.?3.1?The?mapping?result?of?LSH?algorithm??
模型??直观上,在LSH算法中每个桶中的样本足够相似,而在粗糙集理论的等价类划分??中每个等价类子集中的样本特征值相同,说明等价类子集中的样本相似,基于这两个概??念的相似之处,本文提出用LSH算法中桶的划分方法替换原始粗糙集中等价类的划分??方法。下面举例说明两个概念的相似点。....
图4.2以查询为基准的桶划分方法??Fig.?4.2?Bucket?division?method?based?on?query??
分类算法,在这些LSH函数的映射??下,相似度足够高且拥有相同决策属性的样本有很高的概率被划分到同一个桶中。显然,??筛选后的LSH函数有利于进行接下来分类算法的相关工作。??(3)以分类点为基准的桶划分方式??根据局部敏感哈希算法的理论,对于L距离的LSH函数而言,原数据相似程....
图4.3分类算法流程图??Fig.?4.3?The?flow?chart?for?approximate?classification??-27?-??
/本,待分类样本?和w个/??/?LSH?函数。?/???????将《个数掮样本在w个LSH函教下逬行映肘??,形成离散化后的教搨???\?/???计茸每一个眙希函数对于:夬策属性的依赖度??■?^???保留依赖度较高的々个LSH函教??^???循讦刺余的LSH函数???^???....
本文编号:4003842
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/4003842.html
下一篇:没有了