基于聚类算法的标准化K12教育在线平台关键技术研究
【图文】:
第 2 章 聚类分析数据挖掘算法分析我们会给出衡量数据点之间相似度定义的函数。接着进行聚类和分组。步骤 6:数据评估按照步骤 5 的做法,,当我们在数据集上采用一定的算法,得到聚类结果的时候,我们需要对聚类的结果进行评估,评估的任务主要包括估计聚类趋势、确实数据集中的簇数、测定聚类质量。对于聚类趋势,我们之前提到的霍普金斯统计量在我们的算法中将得以体现。2.4 聚类分析的分类聚类分析经过长期的发展,随着科技的发展,大量的科研人员加入到了聚类算法的研究之中,获得了海量的实验成果。目前依然不能对聚类算法做出一个简洁的分类,好多的聚类算法在效率和思想上是比较重叠的,但是根据文献提供的资料,本文把聚类算法分为以下几类:
图 4-1 双聚类输出结果截图其中第一行的内容为该矩阵包含的行数,包含的列数,以及包含均方残差,第二行我们输出的是具体包含了一些列,第三行我们包含了那些的行。每发现的双簇,双聚类的输出的格式,很有利于我观察分类的结果。 值代表的是波动性的判定标准, 值的值和矩阵的大小有很大的关系,当 50 簇时候, 值与矩阵存在如下的关系:表 4.1 值与矩阵关系表 300 280 260 240 220矩阵平均值 2200 2000 1800 1600 12005 实现验证与应用对于 K12 平台而言,能够应用双聚类技术,发掘潜在的价值,满足用户在过程中可能遇到的问题,是一项非常复杂的工作,现在我们就数据集 yeast 行实验,数据中每一行代表的的是基因在不同条件下的表达水平,一共有 2基因,在对数据进行挖掘之前,我们用 log(ratio)进行数据的归一化处理,使
【学位授予单位】:西华师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:G434;TP311.13
【参考文献】
相关期刊论文 前10条
1 李仕伟;周坤;杨艳秋;李宝林;;大数据挖掘技术在在线教育平台中的应用浅析[J];信息通信;2016年09期
2 李仕伟;周坤;刘新蕊;李宝林;;MySQL数据库优化技术[J];信息与电脑(理论版);2016年12期
3 周芳芳;高飞;刘勇刚;梁兴;赵颖;;基于密度-距离图的交互式体数据分类方法[J];软件学报;2016年05期
4 张士豪;顾益军;张俊豪;;基于用户聚类的热门微博分类研究[J];信息网络安全;2015年07期
5 杨震;王来涛;赖英旭;;基于改进语义距离的网络评论聚类研究[J];软件学报;2014年12期
6 周涛;陆惠玲;;数据挖掘中聚类算法研究进展[J];计算机工程与应用;2012年12期
7 顾洪博;;基于k-means算法的k值优化的研究与应用[J];海南大学学报(自然科学版);2009年04期
8 龙真真;张策;刘飞裔;张正文;;一种改进的Chameleon算法[J];计算机工程;2009年20期
9 汪强;;软件体系结构研究[J];电脑知识与技术;2008年35期
10 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
相关硕士学位论文 前10条
1 王洪岩;MOOC中的学习行为挖掘研究[D];山东大学;2016年
2 李录峰;基于Web信息的数据挖掘[D];天津大学;2014年
3 吴细花;“智慧校园”云平台的关键模块设计与实现[D];湖南大学;2014年
4 刘畅;云环境下虚拟机异常的多属性分析[D];大连理工大学;2014年
5 樵建刚;新的基于概率模型的聚类算法研究[D];兰州大学;2014年
6 耿涛;ECG波形可视化聚类策略研究[D];天津理工大学;2013年
7 王威;MySQL数据库源代码分析及存储引擎的设计[D];南京邮电大学;2012年
8 张鹏;基于物理模型的聚类方法研究[D];电子科技大学;2011年
9 于宁;聚类分析方法在学生信息管理系统中的应用[D];中国海洋大学;2010年
10 周骋;基于高维数据的双聚类算法研究与应用[D];南京理工大学;2009年
本文编号:2568463
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyutizhilunwen/2568463.html