当前位置:主页 > 论文百科 > 大学课程 >

考察数据科学家和分析师的 41 个统计学问题

发布时间:2018-08-10 21:25

考察数据科学家和分析师的 41 个统计学问题

授权转载自数据派 THU

ID:DatapiTHU

作者:Dishashree Gupta

编译:闵黎 牋 卢苗苗 丁楠雅

本文是 Analytics Vidhya 所举办的在线统计学测试的原题,有志于成为数据科学家或者数据分析师的同仁可以以这 41 个问题测试自己的统计学水平。

介绍

统计学是数据科学和任何数据分析的基础。良好的统计学知识可以帮助数据分析师做出正确的商业决策。一方面,描述性统计帮助我们通过数据的集中趋势和方差了解数据及其属性。另一方面,推断性统计帮助我们从给定的数据样本中推断总体的属性。了解描述性和推断性统计学知识对于立志成为数据科学家或分析师至关重要。

为了帮助您提高统计学知识,我们进行了这次实践测试。测试涉及描述性和推断性统计。测试题提供了答案和解释,以防你遇到卡壳的问题。

如果您错过了测试,请在阅读答案之前尝试解决问题。

总得分

以下是测试得分的分布情况,帮助您评估您的测试表现。

考察数据科学家和分析师的 41 个统计学问题

Mode Score:25

您可以访问这里(https://datahack.analyticsvidhya.com/contest/skilltest-statistics-3/lb)查看最终成绩。

超过 450 人参加了这次测试,获得的最高分是 37 分。以下是一些关于分数分布的统计数据:

平均得分:20.40

得分中位数:23

得分众数:25

问题与答案

1)哪些统计方法用来度量数据的集中趋势?

A)平均值和正态分布

B)平均值,中位数和众数

C)众数,Alpha 和极差

D)标准差,极差和平均值

E)中位数,极差和正态分布

答案:(B)

平均值,中位数和众数是分析数据集中趋势的三种统计方法。 我们使用这些测量方法来查找数据集的中心值,,以及总结整个数据集。

2)给出 5 个数字:(5,10,15,5,15),求单项数据与平均值之间的离差的和。

A)10

B)25

C)50

D)0

E)以上都没有

答案:(D)

单项数据的离差之和始终为 0。

3)每年进行一次考试。 考试的平均分为 150 分,标准差为 20。如果 Ravi 的 Z 值为 1.50,他的得分是多少?

A)180

B)130

C)30

D)150

答案:(A)

X = μ +Z σ,其中 μ 是平均值,σ 是标准差,X 是我们计算的分数。 因此 X = 150 + 20 * 1.5 = 180

4)如果数据集中的单项数值发生变化,则以下集中趋势中的哪个测量值一定会发生变化?

A)平均值

B)中位数

C)众数

D)上述所有

如果我们改动数据集中的任何值,数据集的平均值一定会改变。 因为平均值是由数据集中的所有值汇总求得的,所以数据集中的每个值都对平均值起作用。 中位数和众数可能会改变,也可能不会随数据集中的单个值而改变。

5)下图所示,标尺的垂线上有六个数据点。

以下哪一条垂直线代表给定数据点的平均值?其中标尺的比例单位相同。

A)A

B)B

C)C

D)D

答案:(C)

从视觉上观察数据点做判断有点困难, 我们可以通过简单的取值来理解平均值。 令 A 为 1,B 为 2,C 为 3 等。 所示的数据值将变为 {1,1,1,4,5,6},这意味着是 18/6 = 3 即 C.

6)如果正偏态分布的中位数为 50,则下列哪个选项是正确的?

A)平均值大于 50

B)平均值小于 50

C)众数小于 50

D)众数大于 50

E)A 和 C

F)B 和 D

答案:(E)

以下是负偏态分布,正态分布和正偏态分布曲线:

考察数据科学家和分析师的 41 个统计学问题

正如我们所看到的正偏态分布的曲线,众数 σ 3

B)σ 1 中位数(V)

因为没有提到变量 V 的分布类型,我们不能肯定地说 V 是有偏的。

38)普通最小二乘法(OLS)线性回归方程得到的回归线试图 ____?

A)通过尽可能多的点

B)通过尽可能少的点

C)最小化所触及的点数

D)最小化点到回归线的距离的平方

回归线尝试最小化点到回归线之间的距离的平方。根据定义,普通最小二乘法回归方程具有误差的平方的最小和。 这意味着残差的平方和也应该是最小化的。这条回归线可能会也可能不会通过最多的数据点。最常见的情况是,当数据有很多离群值或线性关系不是非常强的时候,回归线不是通过所有的点,而是尽量减少通过的点的误差平方和。

39)下表是一个线性回归方程(Y = 5X+40)。

以下哪一项是该线性方程模型的 MAE(平均绝对误差)?

A)8.4

B)10.29

C)42.5

为了计算本题中的平均绝对误差,我们首先用给定的方程计算 Y 值,然后计算相对于实际 Y 值的绝对误差。 那么这个绝对误差的平均值将是平均绝对误差。 下表总结了这些值。

考察数据科学家和分析师的 41 个统计学问题

40)对体重(y)和身高(x)进行回归分析得出以下最小二乘直线:y = 120 + 5x。 这意味着如果身高增加 1 英寸,则预期的体重将?

A)增加 1 磅

B)增加 5 磅

C)增加 125 磅

观察给定方程 y = 120 + 5x, 如果身高增加 1 个单位,则体重将增加 5 磅。因为截距 120 是不变的,不会贡献差异。

41) [ 对错判断 ]

本文编号:2176253



本文链接:https://www.wllwen.com/wenshubaike/dxkc/2176253.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e32b9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com