t 検定
(1グループ)t 検定
の目的1) 標本平均が特定の値かどうか調べる
2) 二つの異なるグループの平均が異なるかどうか調べる
t 検定
を考え出した
William Sealy Gosset という元ギネスビール社員 student's t
という名前で論文を投稿したため、t
検定と呼ばれる degree of freedom
:
標本サイズから 1 を引いた値)が大きくなるにつれ \(t\) 検定の結果と \(z\)
検定の結果は近似していき、標本サイズが無限大だと、両分布は同一になる t 検定
と有意水準t 検定
の手順t 検定
の手順null hypothesis
): \(H_0\)
alternative hypothesis
): \(H_1\)
t
値を計算する
critical values
) を特定する
t
値が棄却域内かどうかを確かめる
具体的な検定プロセス
まず帰無仮説を設定する
帰無仮説とは「棄却されるために設定する仮説」
知りたいのは「サンプル平均は 5.5 だが、母集団の平均は 5
なのか」ということ
帰無仮説 \(H_0\)は「母平均 = 5」
次に対抗仮説を設定する
対抗仮説は「母平均は 5 ではない」
帰無仮説と対抗仮説は相互に排他的
(mutually exclusive
)
次に \(t\) 値を計算する
\(t\) 値は、次の式で求めることができる
\[T = \frac{\bar{x} - μ_0}{SE} = \frac{\bar{x} - μ_0}{u_x / \sqrt{n}}\]
\(\bar{x}\) : 標本平均(ここでは
5.5)
\(μ_0\) : 母集団で推定したい値(ここでは 5)
\(n\) : 標本サイズ(ここでは 10)
\(u_x\): 不偏標準偏差(= 標本標準偏差)
\(SE\) : 標準誤差
(standard Error: SE
)
不偏標準偏差\(u_x\) は不偏分散
(unbiased variance
)の平方根であるから、まず、不偏分散を求める
\(x\) の不偏分散 \(u_x^2\) は次の式で計算できる:
\[u_x^2 = \frac{\sum_{i=1}^n (x_i - \bar{x})^2}{n-1}\]
unbiased standard diviation
) \(u_x^2\) 3.03 が得られる ・母集団の平均は 5
なのかということを確かめたい
→ 母集団で推定したい値 \(μ\)に 5
を代入して、次の \(t\) 値を得る
\[T = \frac{\bar{x} - μ_0}{u_x / \sqrt{n}}\]
\[ = \frac{{5.5} - 5}{3.03 / \sqrt{10}}\]
\[ = 0.522\]
\[ t 分布表\]
\(t\)
分布表内の数値は、検定を行う際の有意水準
(significance leve
) に対応した棄却限界値を示している
標本から得られた \(t\)
値の絶対値が棄却限界値より大きい場合、帰無仮説を棄却する(両側検定の場合)
分布表の横軸は片側検定における有意水準を示している
例えば、二列目の「確率95%」は両側検定における有意水準が 5% \((α = 0.05)\) であることを示す
\(t\) 検定では両側検定で 5%
\((α = 0.05)\)
の有意水準を使うのが一般的
従って、 \(t\)
分布表二列目の「確率95%」を使う
分布表の一列目は自由度 (df: degree of freedom
)
を示している
ここでは「標本サイズ 10 から 1 を引いた 9」 が自由度
縦軸の 9 と横軸の「確率95%」交差する数字「2.262」が 5% の両側検定における棄却限界値
これを図示すると次のようになる
次の図は、自由度 9 の \(t\)
分布における 5% 有意水準\((α =
0.05)\)の 2 つの棄却限界値 (critical value
) -2.26
と 2.26 を示している
significance level
)type I error
)
と呼ばれる significance probability
) = \(p\) 値t 検定
# 標本サイズ 10 のサンプルに score という名前をつける
<- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10) score
# 帰無仮説(母平均 = 5) を `t 検定`する
t.test(score, mu = 5)
One Sample t-test
data: score
t = 0.52223, df = 9, p-value = 0.6141
alternative hypothesis: true mean is not equal to 5
95 percent confidence interval:
3.334149 7.665851
sample estimates:
mean of x
5.5
p-value
が 0.6141 という結果が得られた p-value
= 0.6141 は、両側検定の p 値を表している alternative hypothesis: true mean is not equal to 5
と対抗仮説が明示されている p-value
(0.6141) が 0.05
より大きいので、帰無仮説(「母平均 = 5」)は棄却できない p-value
が 0.05 よりも小さければ 5% の有意水準(α
= 0.05)で帰無仮説を棄却できる # 帰無仮説(母平均 = 3) を `t 検定`する
t.test(score, mu = 3)
One Sample t-test
data: score
t = 2.6112, df = 9, p-value = 0.02822
alternative hypothesis: true mean is not equal to 3
95 percent confidence interval:
3.334149 7.665851
sample estimates:
mean of x
5.5
p-value
が 0.02822 という結果が得られた p-value
= 0.02822 は、両側検定の p 値を表している alternative hypothesis: true mean is not equal to 3
と対抗仮説が明示されている p-value
(0.02822) が 0.05
より小さいので、帰無仮説(「母平均 = 3」)は棄却できる conf.level
を指定する# 帰無仮説(母平均 = 3) を `t 検定`する
t.test(score, mu = 3, conf.level = 0.99)
One Sample t-test
data: score
t = 2.6112, df = 9, p-value = 0.02822
alternative hypothesis: true mean is not equal to 3
99 percent confidence interval:
2.388519 8.611481
sample estimates:
mean of x
5.5
p-value
が 0.02822 という結果が得られた p-value
= 0.02822 は、両側検定の p 値を表している alternative hypothesis: true mean is not equal to 3
と対抗仮説が明示されている p-value
(0.02822) が 0.01
より小さいので、帰無仮説(「母平均 = 3」)は棄却できる 早稲田大学政経学部で携帯スマホ購入者 10 人の平均購入価格を調べたところ、次の統計量を得た
・平均購入価格は 65,000 円
・標本標準偏差は 10,000 円
母集団における携帯スマホの平均購入価格は、50,000
円より高いといえるか?
有意水準 5% で検定しなさい (電卓と\(t\)
分布表を使って手計算で行うこと)(40点)
早稲田大学の A 君は、大隈商店街で喫茶店「ルオー」を開いた A 君は「ルオー」の売上額を正規母集団から観測されるデータをみなし、その母平均μを代表的な売り上げとして 推定しようとした 毎日の売り上げ総額を示す伝票の中からランダムに8 枚を抜き出して みると次のような数字が出てきた
45, 39, 42, 57, 28, 33, 40, 52(単位は万円)
Question
:
母集団では一日あたりの「ルオー」の売り上げが 50
万円である、という仮説を検定しなさい(電卓と\(t\) 分布表を使って手計算で行うこと)
内閣支持29%、不支持52%(NHK世論調査)記事
NHKの世論調査によりますと、菅内閣を「支持する」と答えた人は、先月より4ポイント下がって29%で、去年9月の内閣発足以降最低を更新しました。・・・調査の対象となったのは、2115人で、57%にあたる1214人から回答を得ました。2021年8月(8月10日更新)
prop.test(c(352), c(1214))
1-sample proportions test with continuity correction
data: c(352) out of c(1214), null probability 0.5
X-squared = 213.41, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.2647212 0.3165265
sample estimates:
p
0.2899506
内閣支持率の 95%信頼区間は 26.47% ~ 31.66%
この調査で内閣支持率 29%という推定値を得たからといって「有権者全体における内閣支持率は 30%を切っている」とは 95% の確率ではいえない
仮に、菅内閣を「支持する」と答えたのが 352人ではなく300人だったとすると
prop.test(c(300), c(1214))
1-sample proportions test with continuity correction
data: c(300) out of c(1214), null probability 0.5
X-squared = 309.53, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.2232793 0.2725771
sample estimates:
p
0.247117
22.33% ~ 27.26%
母平均 \(μ\) = 5.5
の正規母集団から、10 個のデータ1, 2, 3, 4, 5, 6, 7, 8, 9, 10
を標本として抽出したとする
ここで、標本サイズ 10 から得られた標本平均は 5.5 であるが、母平均は 3
なのかどうか R を使って確かめなさい