1. t 検定の目的

1) 標本平均が特定の値かどうか調べる
2) 二つの異なるグループの平均が異なるかどうか調べる

  • 前セッションで紹介した中心極限定理によれば、母集団が正規分布していなくても、平均 \(mu\),分散 \(σ^2\) の母集団からの無作為標本における標準誤差の分布は「標本サイズが十分に大きければ」近似的に正規分布に従う 
  • しかし、標本サイズが十分に大きいケースばかりとは限らず、少ない標本サイズしか入手できないことが多々ある 
  • この問題を解決したのが t 検定 を考え出した William Sealy Gosset という元ギネスビール社員 
  • student's t という名前で論文を投稿したため、t 検定と呼ばれる 
  • Gosset は「標本サイズが小さくても」母集団からの無作為標本における標準誤差の分布は \((n-1)\) の自由度で \(t\) 分布することを発見した 
  • この発見のおかげで、小さい標本サイズの場合でも \(t\) 分布の特徴を使うことで統計的推計が可能となった 

2. z 検定と t 検定

  • 標本数が 100 を超える場合、標準正規分布の特徴を使った \(z\) 検定が使われ、標本数が少ないときに限り\(t\) 検定が使われていた 
  • その理由は、\(t\) 検定の統計量である\(t\) を計算するためには、紙上で大規模な\(t\) 分布表を作成する必要があり、その作業が大変だったから 
  • しかし、R や Stata など統計ソフトの開発により、の\(t\) 分布表から容易に\(t\) 値を計算できるようになったため、\(z\) 検定は使われなくなった 
  • 下の\(t\) 分布図が示すように、自由度(degree of freedom: 標本サイズから 1 を引いた値)が大きくなるにつれ \(t\) 検定の結果と \(z\) 検定の結果は近似していき、標本サイズが無限大だと、両分布は同一になる