族谱网 头条 人物百科

学生t检验

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:515
转发:0
评论:0
由来学生t检验是威廉·戈塞为了观测酿酒品质于1908年所提出的,“学生”则是他的笔名。基于克劳德·健力士(ClaudeGuinness)聘用从牛津大学和剑桥大学出来的最好的毕业生,以将生物化学及统计学应用到健力士工业流程的创新政策,戈斯特受雇于都柏林的健力士酿酒厂担任统计学家。戈斯特提出了t检验以降低啤酒质量监控的成本。戈斯特于1908年在《Biometrika》期刊上公布t检验,但因其老板认为其为商业机密而被迫使用笔名。实际上,其他统计学家是知道戈斯特真实身份的。今日,它更常被应用于小样本判断的置信度。应用最常用t检验的情况有:单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如检验一群人的身高的平均是否符合170公分。双样本检验:其零假设为两个正态分布的总体的均值之差为某实数,例如检验二群人的身高之平均是否相等。这一检验通常被称为学生t检验。但更为严格地说,只有两个总...

由来

学生 t 检验是威廉·戈塞为了观测酿酒品质于1908年所提出的,“学生”则是他的笔名。 基于克劳德·健力士(Claude Guinness)聘用从牛津大学和剑桥大学出来的最好的毕业生, 以将生物化学及统计学应用到健力士工业流程的创新政策,戈斯特受雇于都柏林的健力士酿酒厂担任统计学家。戈斯特提出了 t 检验以降低啤酒质量监控的成本。戈斯特于1908年在《Biometrika》期刊上公布t检验,但因其老板认为其为商业机密而被迫使用笔名。实际上,其他统计学家是知道戈斯特真实身份的。

今日,它更常被应用于小样本判断的置信度。

应用

最常用t检验的情况有:

单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如检验一群人的身高的平均是否符合170公分。

双样本检验:其零假设为两个正态分布的总体的均值之差为某实数,例如检验二群人的身高之平均是否相等。这一检验通常被称为学生t检验。但更为严格地说,只有两个总体的方差是相等的情况下,才称为学生t检验;否则,有时被称为Welch检验。以上谈到的检验一般被称作“未配对”或“独立样本”t检验,我们特别是在两个被检验的样本没有重叠部分时用到这种检验方式。

“配对”或者“重复测量”t检验:检验同一统计量的两次测量值之间的差异是否为零。举例来说,我们测量一位病人接受治疗前和治疗后的肿瘤尺寸大小。如果治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸变小了。

检验一条回归线的斜率是否显著不为零。

前提假设

大多数的 t 检定之统计量具有 t = Z / k 的形式,其中 Z 与 k 是已知资料的函数。 Z 通常被设计成对于对立假说有关的形式,而 k 是一个尺度参数使 t 服从于 t 分布。以单样本 t 检验为例, Z = X ¯ ¯ --> / ( σ σ --> / n ) {\displaystyle Z={\bar {X}}/(\sigma /{\sqrt {n}})} ,其中 X ¯ ¯ --> {\displaystyle {\bar {X}}} 为样本平均数, n {\displaystyle n} 为样本数, σ σ --> {\displaystyle \标准差ma } 为总体标准差。至于 k 在单样本 t 检验中为 σ σ --> ^ ^ --> / σ σ --> {\displaystyle {\hat {\sigma }}/\sigma } ,其中 σ σ --> ^ ^ --> {\displaystyle {\hat {\sigma }}} 为样本的标准偏差。在符合零假说的条件下, t 检定有以下前题:

Z 服从标准正态分布

( n - 1) k 服从自由度( n - 1)的卡方分布

Z 与 k 互相独立

 

单样本 t 检验

检验零假说为一群来自常态分配独立样本 x i 之母体期望值 μ 为 μ 0 可利用以下统计量

其中 i = 1 … … --> n {\displaystyle i=1\ldots n} , x ¯ ¯ --> = ∑ ∑ --> i = 1 n x i n {\displaystyle {\overline {x}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}} 为样本平均数, s = ∑ ∑ --> i = 1 n ( x i − − --> x ¯ ¯ --> ) 2 n − − --> 1 {\displaystyle s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}{n-1}}}} 为样本标准偏差, n 为样本数。该统计量 t 在零假说: μ = μ 0 为真的条件下服从自由度为 n − 1的t分布。

配对样本 t 检验

配对样本 t 检验可视为单样本 t 检验的扩展,不过检验的对象由一群来自常态分配独立样本更改为二群配对样本之观测值之差。

若二群配对样本 x 1 i 与 x 2 i 之差为 d i = x 1 i − x 2 i 独立且来自常态分配,则 d i 之母体期望值 μ 是否为 μ 0 可利用以下统计量

其中 i = 1 … … --> n {\displaystyle i=1\ldots n} , d ¯ ¯ --> = ∑ ∑ --> i = 1 n d i n {\displaystyle {\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}} 为配对样本差值之平均数, s d = ∑ ∑ --> i = 1 n ( d i − − --> d ¯ ¯ --> ) 2 n − − --> 1 {\displaystyle s_{d}={\sqrt {\frac {\sum _{i=1}^{n}(d_{i}-{\overline {d}})^{2}}{n-1}}}} 为配对样本差值之标准偏差, n 为配对样本数。该统计量 t 在零假说: μ = μ 0 为真的条件下服从自由度为 n − 1的t分布。

独立双样本 t 检验

样本数及变异数相等

若二群独立样本 x 1 i 与 x 2 i 具有相同之样本数 n ,并且彼此独立及来自二个变异数相等的常态分配,则二群母体之期望值差 μ 1 - μ 2 是否为 μ 0 可利用以下统计量

其中 i = 1 … … --> n {\displaystyle i=1\ldots n} , x ¯ ¯ --> 1 = ( ∑ ∑ --> i = 1 n x 1 i ) / n {\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n} 及 x ¯ ¯ --> 2 = ( ∑ ∑ --> i = 1 n x 2 i ) / n {\displaystyle {\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n} 为二群样本各自的平均数, s p 2 = ( ∑ ∑ --> i = 1 n ( x 1 i − − --> x ¯ ¯ --> 1 ) 2 + ∑ ∑ --> i = 1 n ( x 2 i − − --> x ¯ ¯ --> 2 ) 2 ) / ( 2 n − − --> 2 ) {\displaystyle s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n}(x_{2i}-{\overline {x}}_{2})^{2})/(2n-2)} 为样本之共同变异数。该统计量 t 在零假说: μ 1 - μ 2 = μ 0 为真的条件下服从自由度为2 n − 2的t分布。

样本数不相等但变异数相等

若二群独立样本 x 1 i 与 x 2 j 具有不相同之样本数 n 1 与 n 2 ,并且彼此独立及来自二个变异数相等的常态分配,则二群母体之期望值之差 μ 1 - μ 2 是否为 μ 0 可利用以下统计量

其中 i = 1 … … --> n 1 {\displaystyle i=1\ldots n_{1}} ,其中 j = 1 … … --> n 2 {\displaystyle j=1\ldots n_{2}} , x ¯ ¯ --> 1 = ( ∑ ∑ --> i = 1 n x 1 i ) / n {\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n} 及 x ¯ ¯ --> 2 = ( ∑ ∑ --> i = 1 n x 2 i ) / n {\displaystyle {\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n} 为二群样本各自的平均数, s p 2 = ( ∑ ∑ --> i = 1 n ( x 1 i − − --> x ¯ ¯ --> 1 ) 2 + ∑ ∑ --> j = 1 n ( x 2 j − − --> x ¯ ¯ --> 2 ) 2 ) / ( n 1 + n 2 − − --> 2 ) {\displaystyle s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{1}+n_{2}-2)} 为二群样本共同之变异数。该统计量 t 在零假说: μ 1 - μ 2 = μ 0 为真的条件下服从自由度为 n 1 + n 2 − 2的t分布。

变异数皆不相等

若二群独立样本 x 1 i 与 x 2 j 具有相等或不相同之样本数 n 1 与 n 2 ,并且彼此独立及来自二个变异数不相等的常态分配,则二群母体之期望值之差 μ 1 - μ 2 是否为 μ 0 可利用以下统计量

其中 i = 1 … … --> n 1 {\displaystyle i=1\ldots n_{1}} ,其中 j = 1 … … --> n 2 {\displaystyle j=1\ldots n_{2}} , x ¯ ¯ --> 1 = ( ∑ ∑ --> i = 1 n 1 x 1 i ) / n 1 {\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n_{1}}x_{1i})/n_{1}} 及 x ¯ ¯ --> 2 = ( ∑ ∑ --> j = 1 n 2 x 2 j ) / n {\displaystyle {\overline {x}}_{2}=(\sum _{j=1}^{n_{2}}x_{2j})/n} 为二群样本各自的平均数, s 1 2 = ( ∑ ∑ --> i = 1 n ( x 1 i − − --> x ¯ ¯ --> 1 ) 2 ) / ( n 1 − − --> 1 ) {\displaystyle s_{1}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2})/(n_{1}-1)} 及 s 2 2 = ( ∑ ∑ --> j = 1 n ( x 2 j − − --> x ¯ ¯ --> 2 ) 2 ) / ( n 2 − − --> 1 ) {\displaystyle s_{2}^{2}=(\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{2}-1)} 分别为二群样本之变异数。该统计量 t 在零假说: μ 1 - μ 2 = μ 0 为真的条件下服从自由度为

之t分布。这种方法又常称为Welch检验。

简单线性回归之斜率

在简单线性回归的模型

其中 x i , i = 1, ..., n 为已知, α 与 β 为未知系数, ε i 为残差独立且服从期望值0且变异数 σ 未知的正态分布, y i , i = 1, ..., n 为观测值。我们可以检验回归系数(在此例即为回归式之斜率) β 是否相等于特定的 β 0 (通常使 β 0 = 0以检验 x i 对 y i 是否有关联)。

令 α α --> ^ ^ --> {\displaystyle {\widehat {\alpha }}} 与 β β --> ^ ^ --> {\displaystyle {\widehat {\beta }}} 为最小平方法之估计值, S E α α --> ^ ^ --> {\displaystyle SE_{\widehat {\alpha }}} 与 S E β β --> ^ ^ --> {\displaystyle SE_{\widehat {\beta }}} 为最小平方法估计值之标准误差,则

在零假设为β = β 0 的情况下服从自由度为 n − 2之t分布,其中

由于 ε ε --> ^ ^ --> i = y i − − --> y ^ ^ --> i = y i − − --> ( α α --> ^ ^ --> + β β --> ^ ^ --> x i ) {\displaystyle {\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})} 为残差(即估计误差),而 SSR = ∑ ∑ --> i = 1 n ε ε --> ^ ^ --> i 2 {\displaystyle {\text{SSR}}=\sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}^{\;2}} 为残差之离均平方和,我们可改写 t 为

电脑软件

大多数的试算表软件及统计软件,诸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ([1])、PSPP、Minitab等,都可以进行 t 检验之运算。

参考文献

 


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 学生t-分布
描述假设X{\displaystyleX}是呈正态分布的独立的随机变量(随机变量的期望值是μμ-->{\displaystyle\mu},方差是σσ-->2{\displaystyle\sigma^{2}}但未知)。令:为样本均值。为样本方差。它显示了数量呈正态分布并且均值和方差分别为0和1。另一个相关数量T的概率密度函数是:νν-->{\displaystyle\nu}等于n−1。T的分布称为t-分布。参数νν-->{\displaystyle\nu}一般被称为自由度。ΓΓ-->{\displaystyle\Gamma}是伽玛函数。如果νν-->{\displaystyle\nu}是偶数,如果νν-->{\displaystyle\nu}是奇数,T的概率密度函数的形状类似于均值为0方差为1的正态分布,但更低更宽。随着自由度νν-->{\di...
· 卡方检验
运用建立零假说(NullHypothesis),即认为观测值与理论值的差异是由于随机误差所致;确定数据间的实际差异,即求出卡方值;如卡方值大于某特定概率标准(即显著性差异)下的理论值,则拒绝零假说,即实测值与理论值的差异在该显著性水平下是显著的。相关条目卡方分布学生t检验
· T
字母T的含意字符编码在其他字母系统中的相似字母ⲧ̅:古努比亚语(OldNubianlanguage)里所使用的科普特字母。其他表示方法参看Ττ(希腊字母Tau)Тт(西里尔字母Te)
· 假设检验
说明假设检验的过程,可以用法庭的审理来说明。先想像现在法庭上有一名被告,假设该被告是清白的,而检察官必须要提出足够的证据去证明被告的确有罪。在证明被告有罪前,被告是被假设为清白的。假设被告清白的假设,就相当于零假设(nullhypothesis)。假设被告有罪的假设,则是备择假设(英语:alternativehypothesis)(alternativehypothesis)。而检察官提出的证据,是否足以确定该被告有罪,则要经过检验。这样子的检验过程就相当于用T检验或Z检验去检视研究者所搜集到的统计资料。检验过程在统计学的文献中,假设检验发挥了重要作用。假设检验大致有如下步骤:最初研究假设为真相不明。第一步是提出相关的零假设和备择假设。这是很重要的,因为错误陈述假设会导致后面的过程变得混乱。第二步是考虑检验中对样本做出的统计假设;例如,关于独立性的假设或关于观测数据的分布的形式的假设。这个...
· T恤
T恤历史美国士兵在第一次世界大战期间,注意到欧洲士兵使用的棉质内衣轻巧舒适,而自己的士兵则穿着羊毛(绵)制服,大汗淋漓。这种棉质汗衫在美国士兵之间马上成为抢手货,并其形状而称之为T恤。第二次世界大战期间,T恤成为了美国陆军及海军的标准内衣。二战后T恤开始以外衣形式出现。约翰·韦恩、马龙·白兰度、詹姆士·狄恩都曾在全国电视如此穿着过。公众当初对此大为惊讶,但到了1955年社会开始接受这种服装。詹姆士·狄恩在电影《无因的反抗》中的穿着,让T恤成为时尚的服装。T恤装饰1960年代,T恤成为了西方潮流中年轻人和摇滚音乐爱好者的基本装束。人们也开始以扎染和丝网印刷等方式改装T恤,女装吊带背心、紧身T恤、V领等也逐渐开始流行。自此,T恤成为了自我表达甚至宣传的媒介,展示的图案包罗万有,可以是文字、图画甚至是照片,因此也被称作文化衫。巴黎的一家T恤商店T恤制作的常用面料用于T恤制作的常用面料包括:纯棉汗...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信