理解 t 检验与 F 检验的区别

统计分析 2019. 11. 25. 13:13

声明 本文来自互联网, 内容有删减

 

毕业季, 作者忙的不亦乐乎, 大病小病不断, 总算有时间来更新下~

 

T检验和F检验的由来

 

一般而言, 为了确定从样本(sample)统计结果推论至总体时所犯错的概率, 我们会利用统计学家所开发的一些统计方法, 进行统计检定。

 

通过把所得到的统计检定值, 与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较, 我们可以知道在多少%的机会下会得到目前的结果。

 

倘若经比较后发现, 拒绝出现这样结果的机率很少, 亦即是说, 是在机会很少、很罕有的情况下才会拒绝, 那我们便可以有信心的说, 这不是巧合, 是具有统计学上的意义的(用统计学的话讲, 就是能够拒绝虚无假设null hypothesis, H0)。

 

F值和t值就是这些统计检定值, 与它们相对应的概率分布, 就是F分布和t分布。统计显著性 sig 就是出现目前样本结果的机率。

 

统计学意义 P值或sig值

 

结果的统计学意义是结果真实程度, 能够代表总体, 的一种估计方法。专业上, p值为结果可信程度的一个递减指标, p值越大, 我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。意即通常情况下, p值越小, 对我们的假设越有利。

 

p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联, 我们重复类似实验, 会发现约20个实验中有一个实验, 我们所研究的变量关联将等于或强于我们的实验结果。这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果, 当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。

 

在许多研究领域, 0.05的p值通常被认为是可接受错误的边界水平。这也是为什么我们会经常在论文里看到 p<.05 的原因了。

 

T检验和F检验

 

具体要检定的内容须看你是在使用哪一个统计程序。

 

举一个例子, 比如所你需要检验两独立样本均数差异是否能推论至总体, 而进行t检验。两样本(如某班男生和女生)某变量(如身高)的均数并不相同, 但这差别是否能推论至总体, 代表总体的情况也是存在显著差异呢。

 

会不会总体中男女生根本没有差别, 只不过是你碰巧抽到这2样本的数值不同。

 

为此, 我们进行t检定, 算出一个t检定值。

 

与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较, 看看在多少%的机会(亦即显著性sig值)下会得到目前的结果。

 

若显著性sig值很少, 比如<0.05(少於5%机率), 亦即是说, 「如果」总体「真的」没有差别, 那麼就只有在机会很少(5%)、很罕有的情况下, 才会出现目前这样本的情况。虽然还是有5%机会出错(1-0.05=5%), 但我们还是可以「比较有信心」的说:目前样本中这情况(男女生出现差异的情况)不是巧合, 是具统计学意义的, 「总体中男女生不存差异」的虚无假设应予拒绝, 简言之, 总体应该存在著差异。

每一种统计方法的检定的内容都不相同, 同样是t-检定, 可能是上述的检定总体中是否存在差异, 也可能是检定总体中的单一值是否等於0或者等於某一个数值。

至於F-检定, 方差分析(或译变异数分析, Analysis of Variance), 它的原理大致也是上面说的, 但它是透过检视变量的方差而进行的。它主要用于:均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用、方差齐性(Equality of Variances)检验等情况。

 

T检验和F检验的关系

 

t检验过程, 是对两样本均数(mean)差别的显著性进行检验。惟t检验须知道两个总体的方差(Variances)是否相等, 检验值的计算会因方差是否相等而有所不同。也就是说, t检验须视乎方差齐性(Equality of Variances)结果。所以, SPSS在进行t-test for Equality of Means的同时,也要做Levene's Test for Equality of Variances 。

 

也就是说, 先要Levene分析比较的两个总体的数据分布是否有差异, 有差异和无差异的情况, 最终需要采用的T值是不同的。

 

举例:对某一新上市的产品,韩国和中国消费者的购买意向的比较。

 

1.
在Levene's Test for Equality of Variances一栏中 F值为 6.978, Sig.为.009, 表示方差齐性检验「有显著差异」, 即两方差不齐(Equal Variances), 即数据分布不相同, 故下面t检验的结果表中要看第二排(Equal variances not assumed)的数据, 亦即方差齐的情况下的t检验的结果。



2.
到底看哪个Levene's Test for Equality of Variances一栏中sig,还是看t-test for Equality of Means中那个Sig. (2-tailed)啊?

答案是:两个都要看, 但是在最终的论文里, 限于篇幅的关系, 一般只写t的Sig.。

先看Levene's Test for Equality of Variances, 如果方差齐性检验「没有显著差异」, 即两方差齐(Equal Variances), 故接著的t检验的结果表中要看第一排的数据, 亦即方差齐的情况下的t检验的结果。

反之, 如果方差齐性检验「有显著差异」, 即两方差不齐(Unequal Variances), 故接著的t检验的结果表中要看第二排的数据, 亦即方差不齐的情况下的t检验的结果。


3.
你做的是T检验, 为什么会有F值呢?

就是因为要评估两个总体的方差(Variances)是否相等, 要做Levene's Test for Equality of Variances, 要检验方差, 故所以就有F值。

从两研究总体中随机抽取样本, 要对这两个样本进行比较的时候, 首先要判断两总体方差是否相同, 即方差齐性。若两总体方差相等, 则直接用t检验, 若不等, 可采用t'检验或变量变换或秩和检验等方法。

其中要判断两总体方差是否相等, 就可以用F检验。

若是单组设计, 必须给出一个标准值或总体均值, 同时, 提供一组定量的观测结果, 应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计, 每对数据的差值必须服从正态分布;若是成组设计, 个体之间相互独立, 两组资料均取自正态分布的总体, 并满足方差齐性。之所以需要这些前提条件, 是因为必须在这样的前提下所计算出的t统计量才服从t分布, 而t检验正是以t分布作为其理论依据的检验方法。

简单来说就是使用T检验是有条件的, 其中之一就是要符合方差齐次性, 这点需要F检验来验证。

 

下一期我们会筛选一些学生们的问题, 进行解答。

1、自由度是什么, 怎样确定
2、X方检验中自由度问题
3、t检验和方差分析有何区别
4、如何判定结果具有真实的显著性
5、所有的检验统计都是正态分布的吗
6、假设检验的内涵及步骤
7、卡方检验的结果, 值是越大越好, 还是越小越好
8、配对样本的T检验和相关样本检验有何差别
9、在比较两组数据的率是否相同时, 二项分布和卡方检验有什么不同
10、如何比较两组数据之间的差异性
11、回归分析和相关分析的联系和区别 等等

 

觉得本文有所帮助, 请帮忙点击评论窗下的广告, 谢谢 

 

数据分析

毕业论文的数据分析搞不定吗?数据分析、结果说明、一对一讲解一站式服务

SPSS, AMOS软件的数据分析
毕业论文,期末课题数据分析
论文咨询

posted by Troy C.