当前位置:主页 > 科技论文 > 软件论文 >

大规模复杂数据聚类算法研究

发布时间:2021-04-23 22:50
  作为一种重要的无监督机器学习方法和典型的数据挖掘技术,聚类分析已得到学术界和企业界的广泛关注.近年来,根据不同应用领域的需求,研究者已经发展了一系列聚类模型和算法,并在图像处理、信息检索、社交网络和生物信息学等领域的数据分析中扮演着重要角色.然而,随着大数据、物联网等一系列新兴技术的快速发展与广泛应用,社会活动、科学研究、移动互联网等诸多领域积累了大量复杂数据.需要处理的这些数据呈现出样本规模的海量性、特征规模的高维性、特征表示的混合性、内在结构的复杂性等特点.无论从模型、算法还是应用层面,均给聚类分析提出了严峻挑战.因此,如何从大规模复杂数据中挖掘隐含的类结构成为了一个富有挑战性的研究课题.本文针对数据的大规模性、高维性、混合性、复杂性等特点,采用抽样、子空间聚类、聚类集成、图压缩等技术系统地开展了聚类分析模型与算法的研究.具体地,本文的主要研究内容及取得的研究成果如下:(1)针对大规模数据聚类算法面临的计算效率低下的问题,提出了一个基于分层抽样的聚类算法框架.与其他大多数基于抽样的聚类算法相比,提出的框架在抽样过程中考虑了数据集的分布信息.一个包含大量数据对象或方差较大的数据层应该... 

【文章来源】:山西大学山西省

【文章页数】:144 页

【学位级别】:博士

【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 聚类分析面临的挑战
    1.3 国内外研究现状
        1.3.1 大规模数据聚类算法
        1.3.2 高维数据聚类算法
        1.3.3 混合数据聚类算法
        1.3.4 复杂网络聚类算法
    1.4 研究内容和组织结构
    1.5 本章小结
第二章 基于分层抽样的大规模数据聚类算法
    2.1 引言
    2.2 基于分层抽样的大规模数据聚类算法
        2.2.1 分层抽样
        2.2.2 数据标签
        2.2.3 算法描述
    2.3 实验分析
        2.3.1 实验设置
        2.3.2 实验结果
    2.4 本章小结
第三章 基于信息熵的混合数据软子空间聚类算法
    3.1 引言
    3.2 基于信息熵的混合数据软子空间聚类算法
        3.2.1 混合数据相异性度量方法
        3.2.2 基于信息熵的数值型属性加权机制
        3.2.3 基于信息熵的分类型属性加权机制
        3.2.4 算法描述
    3.3 实验分析
        3.3.1 实验设置
        3.3.2 实验结果
    3.4 本章小结
第四章 基于序列化的混合数据基聚类生成算法
    4.1 引言
    4.2 基于序列化的混合数据基聚类生成算法
        4.2.1 问题描述
        4.2.2 数值型数据期望熵
        4.2.3 分类型数据期望熵
        4.2.4 算法描述
    4.3 实验分析
        4.3.1 实验设置
        4.3.2 实验结果
    4.4 本章小结
第五章 基于有效性指标的分类型数据聚类集成选择算法
    5.1 引言
    5.2 基于有效性指标的分类型数据聚类集成选择算法
        5.2.1 内部有效性指标介绍
        5.2.2 聚类质量与差异性度量
        5.2.3 算法描述
    5.3 实验分析
        5.3.1 实验设置
        5.3.2 实验结果
    5.4 本章小结
第六章 基于图压缩的大规模社交网络聚类算法
    6.1 引言
    6.2 基于图压缩的大规模社交网络聚类算法
        6.2.1 图压缩
        6.2.2 类中心确定
        6.2.3 类中心扩展
        6.2.4 类结构传播
        6.2.5 算法时间复杂度分析
    6.3 实验分析
        6.3.1 实验设置
        6.3.2 实验结果
    6.4 本章小结
第七章 基于社交网络聚类的社会化推荐算法
    7.1 引言
    7.2 基于社交网络聚类的社会化推荐算法
        7.2.1 用户社区及其物品类生成
        7.2.2 物品隶属度矩阵构建
        7.2.3 物品相似度计算
        7.2.4 算法描述
    7.3 实验分析
        7.3.1 实验设置
        7.3.2 实验结果
    7.4 本章小结
第八章 总结与展望
参考文献
攻读博士学位期间取得的研究成果
致谢
个人简况及联系方式



本文编号:3156189

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3156189.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1e63c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com