1. t 検定
- 1.1. t 検定の目的
- 1.2. z 検定と t 検定
2. 1グループの t 検定と有意水準
- 2.1. 手計算による t 検定
- 2.2. R による t 検定
3. EXERCISE
- 3.1. EXERCISE 1
- 3.2. EXERCISE 2
- 3.3. EXERCISE 3
1) 標本平均が特定の値かどうか調べる
2) 二つの異なるグループの平均が異なるかどうか調べる
母平均 μ = 5.5 の正規母集団から、10 個のデータ1, 2, 3, 4, 5, 6, 7, 8, 9, 10 を標本として抽出したとする。
ここで、標本サイズ 10 から得られた標本平均は 5.5 であるが、母平均は 5 なのかどうか確かめたいとする。
これを確かめるために \(t\) 値が必要となる。
t 検定の手順
帰無仮説 \(\mathrm{H_0}\)は「母平均 = 5」
帰無仮説と対抗仮説は相互に排他的 (mutually exclusive)
次に \(t\) 値を計算する。
\(t\) 値は、次の式で求めることができる。
\[T = \frac{\bar{x} - μ_0}{SE} = \frac{\bar{x} - μ_0}{u_x / \sqrt{n}} .\]
不偏標準偏差 \({u_x}\) は不偏分散 (unbiased variance)の平方根であるから、まず、不偏分散を求める。
\(x\) の不偏分散 \(u_x^2\) は次の式で計算できる:
\[u_x^2 = \frac{\sum_{i=1}^n (x_i - \bar{x})^2}{n-1}.\]これより、\(x\) の不偏標準偏差 (unbiased standard diviation) \(u_x\) 3.03 が得られる。
・母集団の平均は 5 なのかということを確かめたい。
→ 母集団で推定したい値 \({μ_0}\) に 5 を代入して、次の \(t\) 値を得る。
\[T = \frac{\bar{x} - μ_0}{u_x / \sqrt{n}}.\]
\[ = \frac{{5.5} - 5}{3.03 / \sqrt{10}}.\]
\[ = 0.522\]
点推定(区間推定に関しては「母平均の推定と信頼区間」を参照)
ここで得られた 0.522 という \(t\) 値を使って 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 という標本サイズ 10 のサンプルから、母集団の母平均が 5 であるという仮説が妥当かどうかを推定する。
\(t\) 分布表
これを図示すると次のようになる。
次の図は、自由度 9 の \(t\) 分布における 5% 有意水準(α = 0.05)の 2 つの棄却限界値 (critical value) -2.26 と 2.26 を示している。
有意水準と有意確率
有意水準 (significance level)
有意確率 (significance probability) = \(p\) 値 (p-value):
# 標本サイズ 10 のサンプルに score という名前をつける
score <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
# 帰無仮説(母平均 = 5) を t 検定する
t.test(score, mu = 5)
One Sample t-test
data: score
t = 0.52223, df = 9, p-value = 0.6141
alternative hypothesis: true mean is not equal to 5
95 percent confidence interval:
3.334149 7.665851
sample estimates:
mean of x
5.5
母平均 \(μ\) = 5.5 の正規母集団から、10 個のデータ1, 2, 3, 4, 5, 6, 7, 8, 9, 10 を標本として抽出したとする。
ここで、標本サイズ 10 から得られた標本平均は 5.5 であるが、母平均は 3 なのかどうか R を使って確かめなさい。
早稲田大学政経学部で携帯スマホ購入者 10 人の平均購入価格を調べたところ、次の統計量を得た。
・平均購入価格は 65,000 円。
・標本標準偏差は 10,000 円。
母集団における携帯スマホの平均購入価格は、50,000 円より高いといえるか?
有意水準 5% で検定しなさい。 (電卓と\(t\) 分布表を使って手計算で行うこと)(40点)
早稲田大学の A 君は、大隈商店街で喫茶店「ルオー」を開いた。A 君は「ルオー」の売上額を正規母集団から観測されるデータをみなし、その母平均μを代表的な売り上げとして 推定しようとした。毎日の売り上げ総額を示す伝票の中からランダムに8 枚を抜き出して みると次のような数字が出てきた。
45, 39, 42, 57, 28, 33, 40, 52(単位は万円)
Q3-1:(20点)
このサンプルを使って、「ルオー」の一日あたり売上額の母平均 \(μ\) の 95% 信頼区間を求めなさい。(電卓を使って手計算で行うこと)
Q3-2:(20点)
母集団では一日あたりの「ルオー」の売り上げが 50 万円である、という仮説を検定しなさい(電卓と\(t\) 分布表を使って手計算で行うこと)
Q3-3:(20点)
上記の検定を R を使って \(t\) 検定した結果を示しなさい。