散点图趋势感知的实验系统设计与实验分析

发布时间:2020-11-19 03:34
   随着大数据时代的发展,数据能够创造越来越多的价值。但是用户很难从大量且不直观的数据中发现数据的价值。可视化可以将数据转化为易于理解的图像,帮助用户快速、准确的发现数据背后隐藏的意义,是分析、理解数据的重要工具。散点图是最常见的二维数据可视化方式,在帮助用户感知数据趋势、相关性和观察数据异常值等方面均发挥重要作用。通常情况下,可视化图表设计人员并不会显式的为用户提供数据趋势线或其它参考信息。即使用户能够通过常用的回归模型计算数据趋势信息,这些统计结果也不一定可靠。因为统计学上常见的数据拟合模型(如普通最小二乘法)容易受数据分布、异常值、异方差等因素的影响,从而导致无法准确地对数据建模。所以,用户在获取数据趋势信息时不能仅仅依靠数值统计方法,还需依靠人类本身对数据的感知和认知能力。相关研究表明,人类使用视觉感知的方式拟合二维数据的数据趋势具有一定的准确性。但已有工作仍存在一定的局限性,用户在使用视觉感知的方式估计散点图数据趋势时可能会受到数据分布和形状编码等因素的影响。所以,在更复杂的数据场景中这种视觉估计方法是否仍然可靠,或者我们是否能够通过一定的手段帮助用户获得更为准确的视觉估计结论,还仍待研究。研究用户如何感知散点图数据趋势,对帮助用户快速、准确的分析和预测数据具有重要的理论意义和应用价值。为了深入探究人类数据感知规律,我们与Tableau公司合作共同研究不同数据分布和形状编码对用户感知散点图数据趋势产生何种影响。在本文中,我们生成了大量具有不同数据分布的散点数据,设计并实现了用来验证不同数据分布和形状编码对用户感知散点图数据趋势影响的实验系统,并从多角度分析用户结果,总结用户感知规律。我们发现,大多数情况下用户可以基本准确地估计数据趋势,使用带有方向性的编码形状可以加强用户对趋势方向的感知能力,帮助用户更加准确的估计散点图数据趋势。
【学位单位】:山东大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:TP311.13
【部分图文】:

散点图,散点图,数据,统计指标


的数据表达方式,在帮助用户感知数据趋势、相关性和观察??异常值分布等方面均发挥重要作用[11。在使用散点图辅助数据分析时,我们通常??还需要使用统计方法计算出一些常用的统计指标(如平均数,中数、众数、平均??差、方差等)来帮助我们完成常见的数据分析任务。但是,由统计方法计算出的??统计指标并不是一直可靠的,使用错误的模型得到的结果很可能会对用户产生一??定的误导。Anscombe’s?quartet121构造了四组具有相同平均数、方差、相关性和线??性回归方程的二维数据,可视化结果如图1-1所示。仅从统计指标上来看,这四??组数据非常相似。但实际上,这四组数据的数据分布是完全不同的,这说明了常??见的趋势统计度量模型(如普通最小二乘方法)容易受数据分布、异常值、异方??差等因素的影响,从而导致无法准确对数据建模[3]。而可视化能够将数据映射成??空间内的视觉元素,允许用户感性的理解和判断感兴趣的数据特征。所以,用户??在进行数据分析时不能仅仅依靠数值统计方法,还需依靠人类本身对数据的感知??和认知能力。??dataMK?>1?datiuMl?s?K?dalasat?>?III?dalaset?■?IV????參??12??W????????????"??????????I??#?????????????8???*?????蠢??<??參?擊??I?[?f??{???[????會?????w?IB?S?10?13?8?to????X?x?X?X??图1-lAnscombe’squartet数据散点图表本??“视觉感知”是指客观事物通过人类视觉

散点图,异常值,实验数据


成96组实验数据,数据趋势的类型为线性、二次、三角函数的实验数据每??种各32个。??在第二项实验中,为了研究用户估计散点图数据截距值准确程度,作者在生??成数据时为所有的数据点添加了一个随机的偏移量。第三项实验与第一项实验中??的数据参数设置也基本相同,但在此基础上从生成的标准髙斯分布数据开头、前??三分之一或结尾处均匀的指定0、5、10或15个数据点作为异常值。将异常值点??放置在主类数据上方或下方、距画布可视区域顶部或底部10%的范围内,并添加??一定的随机偏移量,具体情况如图2-1所示。??n=0?n=5?n=10?n=15??图2-1?“Regression?by?Eye”实验[6冲异常值数量不同的4个实验数据。图中绿色趋势线??为忽略异常值时使用最小二乘线性回归算法拟合的数据趋势,红色线为考虑异常值时使用??最小二乘回归算法拟合的数据趋势??在界面设计和交互设计方面,实验一和实验三在界面中心向用户展示一个散??点图,散点图中心位置放置一条紫色的数据趋势线(初始水平放置),在散点图??10??

散点图,界面图,散点图,结论


?山东大学硕士学位论文???竖直下方位置放置一个滚动条,用户通过调整滚动条的方式调整数据斜率大小,??直到用户觉得该趋势线的斜率与该数据斜率最为接近。实验二主要研究用户估计??散点图数据趋势拟合线的截距的准确程度,因此,在展示实验组数据时,给定的??趋势线始终保持正确的数据斜率,用户通过调整滚动条改变趋势线的上下位置,??从而改变截距估计值。具体实验界面如图2-2所示:?????????%?\??V.?二^???????^????????????*??奢?????參??參傭*??參??丨"????图2-2?Regression?by?Eye实验中的界面图??通过上述三项实验,该工作在散点图感知方面得出以下实验结论??(1)随着数据离散程度增加,用户斜率估计准确程度降低;??(2)用户估计线性趋势和非线性数据趋势准确程度没有显著的统计学差??异;??(3)不同斜率值对用户估计数据趋势准确度没有产生显著的统计学差异;??(4)当数据中存在异常值时,用户倾向于忽略异常值点的影响,其估计结??果更接近不包含异常值的数据点的线性回归结果;??(5)随着异常值点数量的增加,用户受异常值点影响程度增加;??(6)异常值点的位置对用户估计散点图数据趋势没有显著影响。??综上所述,人类依靠视觉感知和认知能力估计散点图数据趋势具有一定的准??确性和可靠性。??11??
【相似文献】

相关期刊论文 前10条

1 ;《临床心电散点图学》介绍[J];中国心脏起搏与心电生理杂志;2019年06期

2 ;《临床心电散点图学》出版[J];中国心脏起搏与心电生理杂志;2016年05期

3 ;《临床心电散点图学》出版[J];中国心脏起搏与心电生理杂志;2016年06期

4 ;《临床心电散点图学》出版[J];临床心电学杂志;2016年06期

5 ;《临床心电散点图学》出版[J];中国心脏起搏与心电生理杂志;2017年01期

6 ;《临床心电散点图学》出版[J];中国心脏起搏与心电生理杂志;2017年02期

7 ;《临床心电散点图学》出版[J];中国心脏起搏与心电生理杂志;2017年03期

8 ;《临床心电散点图学》出版[J];中国心脏起搏与心电生理杂志;2017年04期

9 ;《心电散点图形成的原理与应用研究(学习班资料)》介绍[J];中国心脏起搏与心电生理杂志;2014年06期

10 邱祖红;王为群;;病态窦房结综合征动态心电图与心电散点图诊断结果对比分析[J];中西医结合心脑血管病杂志;2015年11期


相关博士学位论文 前7条

1 董素静;中学理科实验探究教学新模型研究[D];西南大学;2010年

2 王峰;含碳能源直接制氢的实验研究[D];中国科学院研究生院(工程热物理研究所);2007年

3 陈娜;煤矿应急场景下行为能力的实验研究[D];中国矿业大学(北京);2010年

4 张新超;个体腐败行为的实验研究[D];浙江大学;2016年

5 朱宁宁;英美实验音乐:1950-1970年代[D];上海音乐学院;2011年

6 林嘉永;资本市场的实验研究[D];厦门大学;2004年

7 汪敏达;集体行动的实验研究[D];南开大学;2014年


相关硕士学位论文 前10条

1 李晓桐;散点图趋势感知的实验系统设计与实验分析[D];山东大学;2020年

2 邬洋;移动心电诊断系统的研究[D];广东工业大学;2019年

3 陈久红;Lorenz散点图在冠心病患者心率变异性分析中的应用[D];安徽医科大学;2019年

4 戴张印;心电散点图的自动分析研究[D];东南大学;2018年

5 郭慧;基于形态学的T波交替散点图法的研究[D];山东师范大学;2013年

6 张芳芳;正常窦性心律及常见心律失常时间散点图研究[D];郑州大学;2014年

7 徐舫舟;基于ARM的T波交替检测技术[D];山东师范大学;2010年

8 周卓娜;高中化学实验改进的探究与实践[D];湖南师范大学;2013年

9 林秀梅;农村高中生化学实验心理研究[D];福建师范大学;2003年

10 王婷婷;中学生心理素质对化学实验的影响及其解决策略的研究[D];哈尔滨师范大学;2014年



本文编号:2889630

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2889630.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ea9a5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com