SEO外包平台,我们为您提供专业的企业网站SEO整站优化外包服务 SEO设置

SEO外包平台

专注于企业网站SEO整站优化外包服务

如何回答数据面试中T-测验Z-测验的区别?

作者:jcmp      发布时间:2021-04-22      浏览量:0
在北美寻找大数据工作的学生在访谈中被问及

在北美寻找大数据工作的学生在访谈中被问及一些统计概念。

中最常见的问题是告诉我t检验和z检验的区别。

还有一些面试官喜欢以不同的方式提问,比如他们给你一组数据,并问你应该使用什么统计方法来测试这组数据。

首先,让我们考虑一下面试官问这个问题的原因。

有的学生说,我记得大学统计课上学了很多不同的考试啊。为什么这两个测试是面试中最常见的测试,而不是其他测试?

因为在互联网行业,我们做了很多AB测试,比如哪种颜色的支付按钮支付率会很高,哪个页面设置会让用户下更多的订单?

来评估这个实验的结果,我们使用z测试还是t测试。

答案不是很好

我培训了很多学生,采访了很多求职者。有几个不满意的答案:

1)完全不理解

2)概念混淆。和很多其他的统计测试混在一起。与F检验相比,卡方检验的概念是错误的

3)是不系统的。想一想该说些什么&

纯正背诵。知道面试经常问这样的问题,他们是与众不同的。然而,如果面试官立即提出问题,面试官不知道如何回答

一个好答案

什么是好答案?

一个好答案应该是系统的,并且应该有一个框架来回答。

有一个适用于所有面试答案的框架,即使是案例研究,也适用于需要框架的答案。

框架可以帮助您了解您的想法,也可以使侦听器更容易理解。

主题如何应用于框架?

首先,假设(假设)

2)公式(公式)

4)分布图(分布图)

5)查找表(P值查找表)

1)假设(假设)

假设(假设)

从假设的角度来看,它们需要所有样本点是随机和独立的。从这个角度来看,两者是一样的,没有区别。

(有一种特殊情况下的配对样本:t检验,也称为依赖样本t≤检验,其假设样本是独立的。我们不必深入研究这件事。第一,一般数据职位的访谈通常不涉及这一概念,其次,这种类型的t检验并不常用,因此我们不扩展)

2)样本大小

通常z检验至少需要30,t检验没有样本要求,所以小于30的样本可以使用t检验。问题是

。如果样品都大于30呢?都能用吗?让我们看一看公式,

3)公式

我们可以看到分母的标准差是不同的,一个是σ,另一个是需要引入整体标准差,t引入样本标准差。

从公式中,我们可以知道,如果我们知道总体标准差,我们可以使用z检验,但如果总标准差不知道,那么使用t检验。

的具体例子是什么?

小C认为他公司里的女孩都应该体重小于100斤。然后,他询问了50名女孩的体重,得出平均体重为98斤,方差为20斤的结论。这类

属于未知总体方差,但已知样本方差。所以我们用t检验。

4)

我们发现t检验有许多正态分布,它们的形状随样本量的不同而变化。

和z检验只有一个正态分布,由于样本的数据,这一分布不发生变化。我们也称z检验标准正态分布的分布图为

,当样本小于30(前两幅图)时,它们之间的形状仍然有些不同,但当样本大于30时,它们的形状接近。

这个动态网站,您可以体验,非常直观地理解两者之间的区别。
正态分布与t-分布

5)我们发现z检验只需要得到z分数,并根据公式得到z分数和置信区间,得到P值可以是

。T检验,不仅需要引入t值,而且要与样本量一起观察。通过这五种比较发现P值

概括

,t检验和z检验的区别很明显吗?

是否发现关键因素是总体方差是否已知,样本大小是多少?

我们最终使用树形图来推理思路。

最后,因为北美访谈对话风格是问应该回答什么,用八个字来回答,可能会让人觉得他们没有切入要点。
因此,我的建议是,如果您非常了解差异,只需说,方差和样本大小。但要意识到,你已经准备好回答问题,面试官可能会在你回答完之后跟进这些问题。

跟踪

在工作中使用t检验,z检验吗?在统计学类中似乎没有因特网AB测试的例子,我的概念仍然很模糊。

工作中的AB测试实际上要复杂一些,主要是两个样本,而不是上面提到的一个样本的示例,但是上面文章开头提到的基本五点保持不变。下一篇文章

将继续分析AB测试如何在两个样本测试中使用t检验和z检验。

完成。