1. t 検定
の目的
1) 標本平均が特定の値かどうか調べる
2) 二つの異なるグループの平均が異なるかどうか調べる
- 前セッションで紹介した中心極限定理によれば、母集団が正規分布していなくても、平均 \(mu\),分散 \(σ^2\) の母集団からの無作為標本における標準誤差の分布は「標本サイズが十分に大きければ」近似的に正規分布に従う
- しかし、標本サイズが十分に大きいケースばかりとは限らず、少ない標本サイズしか入手できないことが多々ある
- この問題を解決したのが
t 検定
を考え出した William Sealy Gosset という元ギネスビール社員
student's t
という名前で論文を投稿したため、t
検定と呼ばれる
- Gosset は「標本サイズが小さくても」母集団からの無作為標本における標準誤差の分布は \((n-1)\) の自由度で \(t\) 分布することを発見した
- この発見のおかげで、小さい標本サイズの場合でも \(t\) 分布の特徴を使うことで統計的推計が可能となった
2. z 検定と t 検定
- 標本数が 100 を超える場合、標準正規分布の特徴を使った \(z\) 検定が使われ、標本数が少ないときに限り\(t\) 検定が使われていた
- その理由は、\(t\) 検定の統計量である\(t\) を計算するためには、紙上で大規模な\(t\) 分布表を作成する必要があり、その作業が大変だったから
- しかし、R や Stata など統計ソフトの開発により、の\(t\) 分布表から容易に\(t\) 値を計算できるようになったため、\(z\) 検定は使われなくなった
- 下の\(t\) 分布図が示すように、自由度(
degree of freedom
: 標本サイズから 1 を引いた値)が大きくなるにつれ \(t\) 検定の結果と \(z\) 検定の結果は近似していき、標本サイズが無限大だと、両分布は同一になる