library(broom)
library(DT)
library(ggbeeswarm)
library(ggsignif)
library(purrr)
library(rcompanion)
library(rmarkdown)
library(tidyverse)

1. t 検定の目的

1) 標本平均が特定の値かどうか調べる

2) 二つの異なるグループの平均が異なるかどうか調べる

・前セッションで紹介した中心極限定理によれば、母集団が正規分布していなくても、平均 \(\mu\),分散 \(\sigma^2\)の母集団からの無作為標本における標準誤差の分布は「標本サイズが十分に大きければ」近似的に正規分布に従う
・しかし、標本サイズが十分に大きいケースばかりとは限らず、少ない標本サイズしか入手できないことが多々ある
・この問題を解決したのが t 検定 を考え出した William Sealy Gosset という元ギネスビール社員
・student’s t という名前で論文を投稿したため、t 検定と呼ばれる
・Gosset は「標本サイズが小さくても」母集団からの無作為標本における標準誤差の分布は \(n-1\) の自由度で t 分布することを発見
・この発見のおかげで、小さい標本サイズの場合でも t 分布の特徴を使うことで統計的推計が可能となった

・標本をとり、それぞれの標本平均に明らかに違いがあったとする
・しかし、その違いは「標本における」違いに過ぎず、その結果を一般化することはできない
・ここでは、架空のデータを R 上で作り出して、Paired と Unpaired データの二種類のデータに関して t 検定の方法を演習する

2. Paired データの t 検定

・対応のあるサンプルの t 検定 (Paired-samples t-test)
・比較するサンプルに「対応がある」データ
・10 人がモスバーガーとマクドナルドハンバーガーを食べて味を評価する(満点は100点)
・10 人はモスバーガーとマクドナルドハンバーガーの両方を食べる (=> Paired data)
・サンプルの平均点:モスバーガー 80.5 点、マクドナルド 79.5 点 => モスの方がおいしい
「母集団でもそうなのか?」→ t 検定を実行して確かめる必要がある

2.1 データの読み取りと準備