基于HyperMap的多维数据可视化聚类方法及应用研究
本文关键词:从效率视角对我国基础教育阶段公办学校分层的审视——基于对昆明市公办高中的教育生产函数研究,由笔耕文化传播整理发布。
《大连理工大学》 2013年
基于HyperMap的多维数据可视化聚类方法及应用研究
李丽薇
【摘要】:多维数据可视化是将多维数据展现在低维空间中,使得用户更容易发现隐藏在数据中的某些特征,对于数据分析和知识发现具有重要意义。为了保证可视化结果的可靠性,需要在降维过程中最大程度地保持数据的结构信息。本文基于HyperMap的降维可视化方法,从优化的角度提出改进算法,一方面优化目标空间坐标轴的选取,另一方面优化组合权重,以得到最佳的可视化结果,保证可视化过程中最大程度地保持原始数据的结构信息。进一步将可视化方法与聚类方法相结合,形成基于HyperMap的可视化聚类方法。最后,将本文的可视化聚类方法应用到教育数据分析和我国创意产业数据分析中,结果表明本文方法具有较好的实用价值。本文的主要研究工作如下: (1)在介绍FastMap方法和HyperMap方法的基础上,分析了FastMap方法和HyperMap方法的优缺点。其中,HyperMap方法是FastMap方法的改进。这两种方法的本质都是将多维原始数据转化成保持数据结构的低维数据,再将低维数据进行可视化,通过可视化图形观察原始数据的结构信息。降维过程主要分为两步,首先通过选择枢纽点确定目标空间中的坐标轴,然后计算数据集中的样本点在这些坐标轴上的投影坐标。所有样本点在某个坐标轴上的坐标形成一个特征向量。FastMap方法和HyperMap方法主要存在两方面的问题,首先,这两种方法均不能选择最佳的枢纽点,因而不能选出最佳的目标空间的坐标轴。其次,只给出信息损失程度的度量方法,没有指明如何使信息损失达到最小。 (2)提出了改进的HyperMap可视化方法并将其与聚类方法结合,进而形成可视化聚类方法。鉴于FastMap方法和HyperMap方法存在的问题,本文主要进行了两方面的改进。一方面,选择数据集中距离最大的点作为枢纽点,从而选出最佳的坐标轴。另一方面,使用应力函数建立优化模型,通过对模型参数权重的优化,求出最佳的权重组合,从而保证可视化过程信息损失达到最小。另外,可视化结果可以沿任意方向旋转,以消除不同的观察角度对可视化结果的影响。数值实验表明,改进的HyperMap方法提高了HyperMap方法的性能,可以有效应用于多维数据的可视化分析中。将可视化与聚类方法相结合,形成可视化聚类方法。数值实验表明本文可视化聚类方法具有可行性和有效性。 (3)将本文的可视化聚类方法应用到教育数据分析和创意产业数据分析中。阐述教育数据分析中的分类指导问题,并完成数据处理、可视化聚类、分类指导时间制定的过程,为解决分类指导问题提供参考依据。另外,对我国60个主要城市的创意产业数据进行可视化分析,对创意产业总体数据进行排序和群组划分。对生成的经营状况数据进行可视化分析。实验结果表明,本文的可视化聚类方法可以直观地展示数据结构信息,并可以结合聚类方法提高聚类的准确性与合理性,对于分析实际数据,具有一定的实用价值。
【关键词】:
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13
【目录】:
下载全文 更多同类文献
CAJ全文下载
(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)
CAJViewer阅读器支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库 前5条
1 贾泽露,刘耀林,张彤;可视化交互空间数据挖掘技术的探讨[J];测绘科学;2004年05期
2 王斌华;教师评价:增值评价法[J];教育理论与实践;2005年23期
3 马晓强;彭文蓉;萨丽·托马斯;;学校效能的增值评价——对河北省保定市普通高中学校的实证研究[J];教育研究;2006年10期
4 厉无畏,王如忠,缪勇;积极培育和扶持创意产业发展 提高上海城市综合竞争力[J];社会科学;2005年01期
5 陈湘涛;李明亮;陈玉娟;;基于时间序列相似性聚类的应用研究综述[J];计算机工程与设计;2010年03期
【共引文献】
中国期刊全文数据库 前10条
1 郝春晖;周晓宏;;基于知识产权融资的安徽文化创意产业融资模式[J];安徽广播电视大学学报;2012年01期
2 方成武;杨洁;杨晨;汪莉;华兴顺;;安徽中医药文化创意产业发展之思考[J];安徽中医学院学报;2009年05期
3 郑丹华;;成都创意产业发展现状、问题及对策建议[J];北方经济;2011年10期
4 张京成;刘光宇;;我国创意产业发展现状与趋势[J];北京联合大学学报(人文社会科学版);2011年02期
5 丁延庆;薛海平;;从效率视角对我国基础教育阶段公办学校分层的审视——基于对昆明市公办高中的教育生产函数研究[J];北京大学教育评论;2009年04期
6 杨钋;;同伴特征与初中学生成绩的多水平分析[J];北京大学教育评论;2009年04期
7 赵弘;赵燕霞;张西玲;;对我国大城市发展设计服务业的思考——以北京为例[J];北京工商大学学报(社会科学版);2009年02期
8 边玉芳;林志红;;增值评价:一种绿色升学率理念下的学校评价模式[J];北京师范大学学报(社会科学版);2007年06期
9 丁建福;成刚;;义务教育财政效率评价:方法及比较[J];北京师范大学学报(社会科学版);2010年02期
10 杜屏;杨中超;;农村初级中学学校效能的增值性评价——基于我国西部五省调研数据的实证分析[J];北京师范大学学报(社会科学版);2011年06期
中国重要会议论文全文数据库 前10条
1 张国;;伦敦文化创意产业发展对北京的启示[A];2011京津冀区域协作论坛论文集[C];2011年
2 刘光宇;张京成;;打造首都经济圈协同发展京津冀文化创意产业[A];2011京津冀区域协作论坛论文集[C];2011年
3 张国;;伦敦文化创意产业发展对北京的启示[A];创新驱动与首都“十二五”发展——2011首都论坛文集[C];2011年
4 张小洁;徐燕;;北京文化创意指数研究[A];北京市第十五次统计科学讨论会获奖论文集[C];2009年
5 赵家新;;关于发展创意产业的建议——以武汉东湖高薪区为例[A];节能环保 和谐发展——2007中国科协年会论文集(二)[C];2007年
6 杜屏;李琳琳;;基于内容分析法的我国学校效能研究综述[A];2008年中国教育经济学年会会议论文集[C];2008年
7 丁建福;成刚;;义务教育财政效率评价:方法及比较[A];2009年中国教育经济学学术年会论文集[C];2009年
8 杨钋;;大学生资助影响因素的多水平分析[A];2009年中国教育经济学学术年会论文集[C];2009年
9 曹妍;芮潇潇;;英美问责机制下教育增值法的研究综述[A];2010年中国教育经济学学术年会论文集[C];2010年
10 丁建福;成刚;;义务教育财政效率评价:方法及比较[A];2010年中国教育经济学学术年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 杨道宇;课程效能生成的原理研究[D];哈尔滨师范大学;2010年
2 汝安;武术创意产业的发展研究[D];上海体育学院;2010年
3 方忠;中韩文化创意产业经济效应比较研究[D];福建师范大学;2010年
4 陈颖;创意产业集聚区环境对创意企业竞争优势的作用机制研究[D];东华大学;2011年
5 马仁锋;创意产业区演化与大都市空间重构机理研究[D];华东师范大学;2011年
6 王思齐;国家软实力的模式建构[D];浙江大学;2011年
7 杜开林;中国特色社会主义文化产业发展研究[D];南京师范大学;2011年
8 张春瀛;高校教师专业化成熟度测评体系构建研究[D];天津大学;2010年
9 王颖;武汉会展经济发展研究[D];武汉大学;2011年
10 关祥勇;创意企业与创意产业的共同演化研究[D];西北大学;2011年
中国硕士学位论文全文数据库 前10条
1 傅济锋;创意产业实证研究[D];浙江理工大学;2010年
2 赵迪;关于创意产业引领时尚生活的研究[D];辽宁师范大学;2010年
3 陈树永;大连市文化创意产业发展对策研究[D];辽宁师范大学;2010年
4 于琛琛;我国文化创意产业发展对策研究[D];中国海洋大学;2009年
5 钱霞;数字内容产业人力资源公共服务平台运行机制[D];华东师范大学;2010年
6 任文凭;团队过程视角下的创新影响因素研究[D];南京财经大学;2010年
7 靳卫杰;我国动漫产业链优化研究[D];天津理工大学;2010年
8 陈艳;基于LOFT创意园模式的工业遗产旅游研究[D];南昌大学;2010年
9 殷乔尼;创意设计对于实业型企业生产力的激发效应研究[D];华东理工大学;2011年
10 马英平;城市复兴中的创意产业发展规划研究[D];昆明理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 王小飞;英国教师评价制度的新进展——兼PRP体系计划述评[J];比较教育研究;2002年03期
2 李斌,谭立湘,章劲松,庄镇泉;面向数据挖掘的时间序列符号化方法研究[J];电路与系统学报;2000年02期
3 杨风召,朱扬勇;一种有效的量化交易数据相似性搜索方法[J];计算机研究与发展;2004年02期
4 张小涛;李翠玉;;基于模型的不等间隔时间序列聚类算法研究[J];计算机工程与应用;2008年06期
5 肖辉;马海兵;龚薇;;基于时态边缘算子的时间序列分段线性表示[J];计算机工程与应用;2008年19期
6 詹艳艳;徐荣聪;陈晓云;;基于斜率提取边缘点的时间序列分段线性表示方法[J];计算机科学;2006年11期
7 国宏伟;高学东;王宏;;基于异时间窗划分的时间序列聚类[J];计算机工程;2007年21期
8 虞健飞,朱家元,张恒喜;相似时间序列挖掘方法[J];计算机仿真;2003年09期
9 张煜,孟鸿伟;教育研究中的多层分析方法[J];教育研究;1995年02期
10 萨丽·托马斯;彭文蓉;;运用“增值”评量指标评估学校表现[J];教育研究;2005年09期
中国重要报纸全文数据库 前1条
1 姜澎;[N];文汇报;2004年
【相似文献】
中国期刊全文数据库 前10条
1 张文;胡俊;;基于平行坐标技术的关联规则可视化模型[J];北京交通大学学报;2006年02期
2 牛俊英;;基于投影表面分析的三维多分辨率建筑物模型可视化方法[J];顺德职业技术学院学报;2007年01期
3 高飞;樊明辉;关玉梅;陈崇成;;基于维约束的平行坐标可视化及其在数据聚类中的应用[J];福州大学学报(自然科学版);2007年02期
4 荣鹏辉;荣景军;李真;;航空装备保障场景可视化的实现方法[J];计算机应用与软件;2008年05期
5 施惠娟;孙蕾;李由;;关联规则下数据挖掘可视化技术的探讨与实现[J];计算机与现代化;2010年02期
6 武君胜;杨红远;谌洪初;;医学TPS中放射线剂量分布的三维可视化方法[J];计算机应用;2010年03期
7 何亚文;杜云艳;苏奋振;肖如林;;利用空间信息网格的海流场远程可视化[J];武汉大学学报(信息科学版);2010年03期
8 刘旭龙;洪文学;张涛;樊凤杰;宋佳霖;;基于形式概念分析的中医辩证可视化方法[J];燕山大学学报;2010年02期
9 吴德胜;虞强源;;一种基于褶集的模糊区域可视化模型[J];系统仿真学报;2006年S1期
10 杨振乾;王学义;;装备保障指挥可视化系统的设计与实现[J];科学技术与工程;2007年16期
中国重要会议论文全文数据库 前10条
1 张二华;马仁安;赵春霞;杨静宇;;三维地震数据场的面可视化方法[A];中国地球物理.2003——中国地球物理学会第十九届年会论文集[C];2003年
2 余弦;吴锋;;一种危险品运输车辆监控信息可视化方法[A];浙江省信号处理学会2011学术年会论文集[C];2011年
3 陈乃宏;Hideyoshi Higashi;;可视化方法对海马初代培养细胞内CaMK Ⅱ活性的观察[A];生命科学与生物技术:中国科协第三届青年学术年会论文集[C];1998年
4 廖丽;王弘堃;;基于纹理的流场可视化方法消除高频噪声的技术[A];中国工程物理研究院科技年报(2008年版)[C];2009年
5 刘晓平;李书杰;石慧;;规律维问题初探[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册)[C];2006年
6 姜慧研;;医学图像三维可视化方法[A];中国图象图形学学会立体图象技术专业委员会学术研讨会论文集(第三期)[C];2009年
7 曹轶;姚彦忠;费月娥;;一种改进的应用纹理表现二维矢量场的可视化[A];中国工程物理研究院科技年报(2000)[C];2000年
8 钟登华;朱慧蓉;黄伟;;水利工程施工总布置动态信息可视化方法研究[A];中国水利学会2003学术年会论文集[C];2003年
9 胡海敏;李静惊;吴宜灿;;多维中子输运SN计算程序辅助建模与计算结果可视化方法研究[A];第二届全国反应堆物理与核材料学术研讨会论文集[C];2005年
10 栾春娟;;NB会聚技术可视化及启示[A];第五届(2010)中国管理学年会——技术与创新管理分会场论文集[C];2010年
中国重要报纸全文数据库 前7条
1 张继民 黎昌政;[N];中国矿业报;2006年
2 海潮;[N];学习时报;2006年
3 王亮 李静华 刘纪平;[N];计算机世界;2008年
4 记者 李庆华;[N];中国劳动保障报;2004年
5 记者 李大庆;[N];科技日报;2007年
6 记者 赵亚辉;[N];人民日报;2006年
7 本报记者 李闻芝;[N];中国化工报;2005年
中国博士学位论文全文数据库 前10条
1 孙扬;多变元网络数据可视化方法研究[D];国防科学技术大学;2010年
2 张涛;基于语音特征的帕金森病可视化诊断方法研究[D];燕山大学;2012年
3 徐永红;基于多元数据子空间坐标图表示的可视化模式识别[D];燕山大学;2010年
4 曲朝阳;智能电网知识可视化引擎的研究[D];华北电力大学(河北);2010年
5 邓野;CTCS-3测试仿真环境可视化关键技术的研究[D];北京交通大学;2010年
6 杨树忠;复杂网络中的社团检测问题研究[D];北京交通大学;2009年
7 徐华勋;复杂流场特征提取与可视化方法研究[D];国防科学技术大学;2011年
8 孟辉;基于图表达蛋白质组学质谱模式的癌症诊断可视化方法研究[D];燕山大学;2011年
9 刘振平;工程地质三维建模与计算的可视化方法研究[D];中国科学院研究生院(武汉岩土力学研究所);2010年
10 张婷;科学传播研究的可视化分析[D];大连理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 竺银瑶;基于行为关系的电子病历数据集成可视化研究[D];浙江大学;2010年
2 赵旭;六西格玛项目管理与分析系统可视化研究与实现[D];北方工业大学;2011年
3 张志刚;基于面向对象的有限元可视化方法及实现[D];重庆大学;2005年
4 夏超文;基于三维城市规划的城市建模方法研究与实现[D];武汉大学;2005年
5 王芸芸;植物器官精细建模与可视化[D];大连理工大学;2010年
6 游进国;一种OLAP可视化方法的研究及其实现[D];昆明理工大学;2005年
7 杨文强;复杂电磁环境下的态势展示[D];北京邮电大学;2009年
8 毛云建;多维时间序列数据挖掘的方法研究及应用[D];上海交通大学;2007年
9 温维亮;基于隐式曲面的三维树木建模及其可视化[D];大连理工大学;2008年
10 李维;注射成型过程可视化研究及缺陷分析[D];北京化工大学;2008年
本文关键词:从效率视角对我国基础教育阶段公办学校分层的审视——基于对昆明市公办高中的教育生产函数研究,,由笔耕文化传播整理发布。
本文编号:123312
本文链接:https://www.wllwen.com/zhongdengjiaoyulunwen/123312.html