基于复杂网络的数据挖掘分类问题研究与应用
发布时间:2020-12-16 08:53
随着信息技术的快速发展,特别是计算机技术的不断普及,“数据丰富而信息贫乏”这一矛盾显得日益突出,数据挖掘技术正是迎合了这一需求,同时结合数理统计、人工智能、神经网络和信息技术等学科出现的一项新技术,并得到了迅速发展。数据挖掘的主要目的是从数据集中发现隐含的、事先未知的和用户感兴趣的知识。作为一种有效的数据分析技术,近年来分类(Classification)已成为数据挖掘领域中的一项重要研究内容,并广泛应用于商业、电子商务、基因工程和医学等诸多领域。复杂网络作为一门新兴学科,在不同的领域(如生态、人口、经济、社会、地理、军事、医学)中有着很强的应用背景,倍受广大学者的青睐和关注,已成为一个充满生命力的交叉研究领域。一切事物都是相互作用的表现,大多可以通过复杂网络来表现,如物理学研究物体间最基本的相互作用;化学研究分子间的相互作用;生物学研究基因、蛋白质以及生物体之间的相互作用;社会科学研究人和各种人类组之间的相互作用;分类问题研究数据点之间的相互作用。因此,事物作为系统,其结构可以抽象为网络,各类作用体抽象为网络节点,各种相互作用抽象为节点之间的连接线或边。基于这种思想,本文将数据集按照...
【文章来源】:辽宁师范大学辽宁省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
经济物理学科学家合作网(不同颜色代表不同的社团)
基于复杂网络的数据挖掘分类问题研究与应用有最短路径,且算法复杂度为口(m);聚类中心的确立时间复杂度为口(xn);其余节点的归类的时间复杂度为O(n);则算法的时间复杂度为口((k+l)。+m),为线性阶。
基于复杂网络的数据挖掘分类问题研究与应用算法(wcNFc)〔70〕和本文算法对文本进行了分类,图5.3表明本文算法在分类精度上优于WCNFC算法,(本文是用MATLAB编程实现的,基于MATLAB的解析过程和机器性能,本文的方法还是可以接受的)。(0,0︶侧婴测试集图5.3本文算法与WCNFC算法分类精度比较5.4小结本章将遗传算法思想和复杂网络社团划分的思想结合在一起,提出一种新的分类算法。首先依据相似度矩阵构造复杂网络;其次使用遗传算法进行分类。相比其它算法而言本文算法无需知道数据集中的类别信息,只需按照实际问题相关的度量函数构造出相似网络。此外在现有的串行计算机上,还无法体现遗传算法的并行性所带来的高速计算能力
【参考文献】:
期刊论文
[1]一种基于加权复杂网络特征的K-means聚类算法[J]. 赵鹏,耿焕同,蔡庆生,王清毅. 计算机技术与发展. 2007(09)
[2]数据挖掘分类算法研究综述[J]. 王刚,黄丽华,张成洪,夏洁. 科技导报. 2006(12)
[3]一个医学图像分类器的设计[J]. 李丙春,耿国华,周明全,孙蕾. 计算机工程与应用. 2004(17)
[4]决策树分类技术研究[J]. 栾丽华,吉根林. 计算机工程. 2004(09)
[5]数据挖掘中的数据分类算法综述[J]. 刘红岩,陈剑,陈国青. 清华大学学报(自然科学版). 2002(06)
博士论文
[1]基于复杂网络理论的投入产出关联分析[D]. 方爱丽.青岛大学 2008
[2]医学图像数据挖掘若干技术研究[D]. 宋余庆.东南大学 2005
硕士论文
[1]多分类器组合及其在医学图像分类中的应用[D]. 张春芬.江苏大学 2007
[2]基于多分类器融合的数据挖掘分类算法研究与应用[D]. 梁勇林.重庆大学 2007
[3]基于启发式遗传算法的属性约简方法研究[D]. 杨悦.哈尔滨工程大学 2006
[4]数据挖掘分类算法的研究与应用[D]. 刘振岩.首都师范大学 2003
本文编号:2919889
【文章来源】:辽宁师范大学辽宁省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
经济物理学科学家合作网(不同颜色代表不同的社团)
基于复杂网络的数据挖掘分类问题研究与应用有最短路径,且算法复杂度为口(m);聚类中心的确立时间复杂度为口(xn);其余节点的归类的时间复杂度为O(n);则算法的时间复杂度为口((k+l)。+m),为线性阶。
基于复杂网络的数据挖掘分类问题研究与应用算法(wcNFc)〔70〕和本文算法对文本进行了分类,图5.3表明本文算法在分类精度上优于WCNFC算法,(本文是用MATLAB编程实现的,基于MATLAB的解析过程和机器性能,本文的方法还是可以接受的)。(0,0︶侧婴测试集图5.3本文算法与WCNFC算法分类精度比较5.4小结本章将遗传算法思想和复杂网络社团划分的思想结合在一起,提出一种新的分类算法。首先依据相似度矩阵构造复杂网络;其次使用遗传算法进行分类。相比其它算法而言本文算法无需知道数据集中的类别信息,只需按照实际问题相关的度量函数构造出相似网络。此外在现有的串行计算机上,还无法体现遗传算法的并行性所带来的高速计算能力
【参考文献】:
期刊论文
[1]一种基于加权复杂网络特征的K-means聚类算法[J]. 赵鹏,耿焕同,蔡庆生,王清毅. 计算机技术与发展. 2007(09)
[2]数据挖掘分类算法研究综述[J]. 王刚,黄丽华,张成洪,夏洁. 科技导报. 2006(12)
[3]一个医学图像分类器的设计[J]. 李丙春,耿国华,周明全,孙蕾. 计算机工程与应用. 2004(17)
[4]决策树分类技术研究[J]. 栾丽华,吉根林. 计算机工程. 2004(09)
[5]数据挖掘中的数据分类算法综述[J]. 刘红岩,陈剑,陈国青. 清华大学学报(自然科学版). 2002(06)
博士论文
[1]基于复杂网络理论的投入产出关联分析[D]. 方爱丽.青岛大学 2008
[2]医学图像数据挖掘若干技术研究[D]. 宋余庆.东南大学 2005
硕士论文
[1]多分类器组合及其在医学图像分类中的应用[D]. 张春芬.江苏大学 2007
[2]基于多分类器融合的数据挖掘分类算法研究与应用[D]. 梁勇林.重庆大学 2007
[3]基于启发式遗传算法的属性约简方法研究[D]. 杨悦.哈尔滨工程大学 2006
[4]数据挖掘分类算法的研究与应用[D]. 刘振岩.首都师范大学 2003
本文编号:2919889
本文链接:https://www.wllwen.com/projectlw/xtxlw/2919889.html