基于Web的机器学习可视化系统的设计与实现
发布时间:2022-01-07 15:22
随着大数据时代的来临,人们每天都在接触各种各样的数据信息。据统计,人类从外界获取的信息约有80%以上都是来自视觉系统,良好的可视化更能有效的帮助人们理解数据背后隐藏的信息,发掘出数据之间的规律。但随着计算机行业高新技术的兴起,数据模型也越来越复杂多变,因此需要将可视化技术与机器学习技术相结合更高效的去处理数据。然而目前大多数的研究者都关注于机器学习算法本身的优化,却忽略了对算法输出结果的可视化,无法直观地看到算法的运行过程。因此本文重点分析了与机器学习技术相关的三个可视化领域的研究现状,同时也对国内外现有的数据可视化工具进行了调研和对比,发现目前存在较少的机器学习可视化工具。针对以上问题,本文的具体研究工作如下:1.提出了一种基于Web的机器学习可视化方案;将机器学习技术与Web前端D3.js可视化技术进行结合,同时使用jQuery、JavaScript以及Bootstrap等Web前端技术,对K近邻算法(KNN)和支持向量机(SVM)算法进行Web前端可视化开发,并实现了Web前端界面实时调参的功能。2.设计并实现了一个基于Web的机器学习可视化系统;给出了机器学习可视化系统的总体设...
【文章来源】:浙江工商大学浙江省
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
拿破仑进军莫斯科的事件流图
41.3.1网络或空间数据可视化网络数据可视化是大数据领域内最常见的研究领域,它可以通过网络结点或者相连的网络拓扑关系有效的展示网络中存在的模式关系,如何对网络特性进行可视化[15]也成了近些年研究的热点。2011年,Gou等人在基于Voronoi图填充[16]、矩形填充等树可视化技术之上,提出了一种TreeNetViz网络图可视化技术,直观有效的展示了图结点之间的关系。在网络或空间数据可视化中,聚类和分类也已经被广泛用于识别感兴趣的领域。2014年,SeungJinLim[17]提出了一个可视化工具来增强支持向量机的实用性,它提供对每个数据点到最佳超平面的距离测量的访问,此外,还提供特征空间中距离值的分布,支持平移、缩放等交互功能,以此来提高SVM的性能。2015年,FelixBrodkorb[18]等人提出了一种基于时空图和聚类的质量流动动力学可视化分析方法[19],并开发出一种基于图形的方法,称为MobilityGraphs。如图1.2所示,它能够在长时间序列的空间情境中实现运动的时空变化的视觉表示。2018年,王文波等人提出利用可视化改进异构信息网络的聚类分析[20],使用经典的聚类方法Rankclus,使得整个集群的聚类[21]计算过程对用户来说是透明的,通过可视化结果,用户可以根据需求调整算法参数,最后通过热力图和DOItree[22]两种可视化技术来提高可视化质量。图1.2伦敦城市原始地图图像的移动图示例1.3.2时间序列可视化在时间序列数据可视化中,一个巨大的挑战就是在有限的显示空间上呈现大型数据集并且不会过度绘图。为了解决时空立方体面临的数据集杂乱问题,2012年,Tominski[23]
5等人使用密度图[24]与散点图结合的方式对时空立方体进行优化,引入了堆积图(stackgraph),将二维与三维进行融合,拓展了多维展示空间。在图1.3时间序列可视化图中,2015年,JamesWalker等人提出一种有效的方法[25],当屏幕分辨率与数据相比较小时,将数据点聚合成时间段,并创建多焦点缩放线图的层次结构。同年,YoshihiroOkada等人提出一种基于Web的Time-tunnel可视化方案[26],它可以在Web浏览器中呈现时间序列多维数据的3D图表,支持将图表重叠在一起来查找多个数据之间的差异和相似之处,使用遗传算法优化数据进行分类,然后将几个数据图表可视化为一组,此外,用户还可以通过指定系统生成的URL与其他用户共享可视化结果。2016年,PatrickM.J.Dubois等人提出一种用于频繁模式挖掘的交互式可视化工具分析(icVAT)[27],它使用无方向的圆形布局来显示频繁的图案。此外,它还为用户提供交互式功能,以明确显示超集和访问过的网页集的子集之间的连接。图1.3时间序列数据可视化示例1.3.3文本数据可视化文本信息是当前互联网领域内最重要的信息类型之一,人们在日常生活中接触最多的信息主要也是以文本形式存在的。在文本数据可视化中[28],诸如实体提娶主题识别以及情感分析之类的文本可视化技术变得至关重要。因为海量信息使人们处理和理解难度日益增大,传统的文本分析技术提取的信息仍然无法满足人们对信息的获龋2008年,Hipp[29]等人提出一种基于层次化点排布的投影技术,将一维的文本内容通过投影的形式投射到高维空间中,以此来展示文本中的聚类关系。2012年,Chevalier[30]等人提出
【参考文献】:
期刊论文
[1]面向文本的标签云可视化度量模型的研究[J]. 马明明,胡俊. 软件. 2018(05)
[2]一种三维网络GIS空间数据可视化方法的研究[J]. 江勇. 北京测绘. 2018(02)
[3]基于QlikView的电网规划数据集成方法研究[J]. 屈少青,隆辉,王鹏,张超,柳明,韦朦. 湖南电力. 2017(04)
[4]文本数据可视化之标签云[J]. 骆逸欣. 电子技术与软件工程. 2017(13)
[5]基于标签云系统共现分析的用户兴趣预测模型[J]. 周朴雄,陈蓓蓉. 情报杂志. 2017(05)
[6]基于eCharts的动态统计图表绘制技术研究[J]. 宋佳慧,刘远刚,林琳,李绅弘,许帆. 电脑知识与技术. 2017(12)
[7]信息可视化的发展与思考[J]. 付心仪,刘世霞,徐迎庆. 装饰. 2017(04)
[8]大数据分析技术发展迅猛,机遇挑战并存[J]. 贾焰,周斌. 信息通信技术. 2016(06)
[9]基于SVG/GML的WebGIS空间数据可视化模型研究与应用[J]. 李心颖,李峰,吴洪丽. 数字技术与应用. 2016(11)
[10]基于可视化技术的中国代建制研究综述[J]. 吕途,戴大双. 建筑经济. 2016(09)
本文编号:3574784
【文章来源】:浙江工商大学浙江省
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
拿破仑进军莫斯科的事件流图
41.3.1网络或空间数据可视化网络数据可视化是大数据领域内最常见的研究领域,它可以通过网络结点或者相连的网络拓扑关系有效的展示网络中存在的模式关系,如何对网络特性进行可视化[15]也成了近些年研究的热点。2011年,Gou等人在基于Voronoi图填充[16]、矩形填充等树可视化技术之上,提出了一种TreeNetViz网络图可视化技术,直观有效的展示了图结点之间的关系。在网络或空间数据可视化中,聚类和分类也已经被广泛用于识别感兴趣的领域。2014年,SeungJinLim[17]提出了一个可视化工具来增强支持向量机的实用性,它提供对每个数据点到最佳超平面的距离测量的访问,此外,还提供特征空间中距离值的分布,支持平移、缩放等交互功能,以此来提高SVM的性能。2015年,FelixBrodkorb[18]等人提出了一种基于时空图和聚类的质量流动动力学可视化分析方法[19],并开发出一种基于图形的方法,称为MobilityGraphs。如图1.2所示,它能够在长时间序列的空间情境中实现运动的时空变化的视觉表示。2018年,王文波等人提出利用可视化改进异构信息网络的聚类分析[20],使用经典的聚类方法Rankclus,使得整个集群的聚类[21]计算过程对用户来说是透明的,通过可视化结果,用户可以根据需求调整算法参数,最后通过热力图和DOItree[22]两种可视化技术来提高可视化质量。图1.2伦敦城市原始地图图像的移动图示例1.3.2时间序列可视化在时间序列数据可视化中,一个巨大的挑战就是在有限的显示空间上呈现大型数据集并且不会过度绘图。为了解决时空立方体面临的数据集杂乱问题,2012年,Tominski[23]
5等人使用密度图[24]与散点图结合的方式对时空立方体进行优化,引入了堆积图(stackgraph),将二维与三维进行融合,拓展了多维展示空间。在图1.3时间序列可视化图中,2015年,JamesWalker等人提出一种有效的方法[25],当屏幕分辨率与数据相比较小时,将数据点聚合成时间段,并创建多焦点缩放线图的层次结构。同年,YoshihiroOkada等人提出一种基于Web的Time-tunnel可视化方案[26],它可以在Web浏览器中呈现时间序列多维数据的3D图表,支持将图表重叠在一起来查找多个数据之间的差异和相似之处,使用遗传算法优化数据进行分类,然后将几个数据图表可视化为一组,此外,用户还可以通过指定系统生成的URL与其他用户共享可视化结果。2016年,PatrickM.J.Dubois等人提出一种用于频繁模式挖掘的交互式可视化工具分析(icVAT)[27],它使用无方向的圆形布局来显示频繁的图案。此外,它还为用户提供交互式功能,以明确显示超集和访问过的网页集的子集之间的连接。图1.3时间序列数据可视化示例1.3.3文本数据可视化文本信息是当前互联网领域内最重要的信息类型之一,人们在日常生活中接触最多的信息主要也是以文本形式存在的。在文本数据可视化中[28],诸如实体提娶主题识别以及情感分析之类的文本可视化技术变得至关重要。因为海量信息使人们处理和理解难度日益增大,传统的文本分析技术提取的信息仍然无法满足人们对信息的获龋2008年,Hipp[29]等人提出一种基于层次化点排布的投影技术,将一维的文本内容通过投影的形式投射到高维空间中,以此来展示文本中的聚类关系。2012年,Chevalier[30]等人提出
【参考文献】:
期刊论文
[1]面向文本的标签云可视化度量模型的研究[J]. 马明明,胡俊. 软件. 2018(05)
[2]一种三维网络GIS空间数据可视化方法的研究[J]. 江勇. 北京测绘. 2018(02)
[3]基于QlikView的电网规划数据集成方法研究[J]. 屈少青,隆辉,王鹏,张超,柳明,韦朦. 湖南电力. 2017(04)
[4]文本数据可视化之标签云[J]. 骆逸欣. 电子技术与软件工程. 2017(13)
[5]基于标签云系统共现分析的用户兴趣预测模型[J]. 周朴雄,陈蓓蓉. 情报杂志. 2017(05)
[6]基于eCharts的动态统计图表绘制技术研究[J]. 宋佳慧,刘远刚,林琳,李绅弘,许帆. 电脑知识与技术. 2017(12)
[7]信息可视化的发展与思考[J]. 付心仪,刘世霞,徐迎庆. 装饰. 2017(04)
[8]大数据分析技术发展迅猛,机遇挑战并存[J]. 贾焰,周斌. 信息通信技术. 2016(06)
[9]基于SVG/GML的WebGIS空间数据可视化模型研究与应用[J]. 李心颖,李峰,吴洪丽. 数字技术与应用. 2016(11)
[10]基于可视化技术的中国代建制研究综述[J]. 吕途,戴大双. 建筑经济. 2016(09)
本文编号:3574784
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3574784.html