当前位置:主页 > 科技论文 > 自动化论文 >

哈希降维与K均值聚类模型的改良

发布时间:2021-01-09 16:07
  机器学习在高维数据种的应用非常广泛,同时也存在许多问题。高维数据如何降维,存储,分析和管理都是机器学习任务种经常遇到的问题,本文研究和扩展现有哈希降维与K均值聚类模型,提出新的哈希算法对哈希函数构造中通常没有考虑数据相似结构的问题和高维数据的聚类算法存在的一些问题进行研究。具体地说,(1)提出了一种基于PCA的方差旋转哈希算法(Principle Component Analysis Rotation Hashing Algorithm,PCAR)。哈希算法由于能将高维数据编码为二进制字符串而被广泛的应用于高维数据降维问题,但是现有的哈希算法仍然存在如下问题:(i)、传统的哈希算法采用固定的数学公式构造哈希函数,无法对数据拟合,因而无法获得好的哈希效果;(ii)、现有哈希算法通常分别学习哈希函数与二值化阈值,过程繁杂容易造成误差;(iii)、已有一些改进的哈希算法没有同时考虑数据的全局与局部的结构信息。因此,本文第三章提出的PCAR算法结合了PCA(主成分分析)和流形学习来解决传统哈希算法通常只考虑一种结构的不足。详细地说,PCAR算法利用PCA(主成分分析)保留数据的整体相似结构,同... 

【文章来源】:广西师范大学广西壮族自治区

【文章页数】:41 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 选题及研究背景
    1.2 本文研究内容和结构框架
第二章 相关基础知识
    2.1 PCA哈希算法
    2.2 流形学习哈希
    2.3 K-means聚类
    2.4 自步学习
第三章 基于PCA与流形学习的哈希算法
    3.1 引言
    3.2 PCAR算法
        3.2.1 算法思想
        3.2.2 优化求解
    3.3 实验结果和分析
        3.3.1 实验数据和评价指标
        3.3.2 实验结果分析
    3.4 本章小结
第四章 基于自步学习的K-means聚类算法
    4.1 引言
    4.2 算法描述
        4.2.1 SPKC算法
        4.2.2 优化分析求解
    4.3 实验与结果分析
        4.3.1 实验数据集和评价指标
        4.3.2 实验结果和分析
    4.4 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
攻读硕士期间取得的科研成果
攻读硕士期间研究项目情况
致谢


【参考文献】:
期刊论文
[1]大数据哈希学习:现状与趋势[J]. 李武军,周志华.  科学通报. 2015(Z1)
[2]基于提升小波变换和BP神经网络的图像哈希算法[J]. 张敏,康志伟,陈步真.  计算机应用研究. 2010(10)
[3]基于内容图像检索中的索引技术[J]. 贺玲,吴玲达,蔡益朝.  计算机应用研究. 2005(11)
[4]基于核的K-均值聚类[J]. 孔锐,张国宣,施泽生,郭立.  计算机工程. 2004(11)
[5]文档聚类中k-means算法的一种改进算法[J]. 万小军,杨建武,陈晓鸥.  计算机工程. 2003(02)



本文编号:2966980

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2966980.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0cf36***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com