1. 推定と検定
2. 母集団と標本
3. 中心極限定理
4. 標本分布
-宿題4-1 (20点)
-宿題4-1 (20点)
5. 信頼区間
6. 母平均の推定と信頼区間
-宿題6-1 (60点)
7. 確率変数・確率分布・確率密度関数
8. 期待値

1. 推定と検定

  1. 点推定・・・標本から判断して、具体的な母数の値を予想する。
    ex: 「早稲田大学全体で女子学生の平均身長は 160 cm くらいだろう
  2. 区間推定・・・標本から判断して(ある程度の幅を持った区間で)具体的な母数の値を予想する。
    ex: 「早稲田大学全体で女子学生の平均身長は 160 cm から 165 cm くらいだろう

2. 母集団と標本

example:
* 矢内さんは人口328万人の郡山市に行って、東日本大震災に関して二つの標本をとった。
* 標本 A では 1,000 人を対象に世論調査を実施し、標本 B では 2,000 人に対して世論調査を行った。

→ 標本数は 2(標本 A と標本 B)であり、標本サイズはそれぞれ 2,000 と 1,000 である。    

母数と統計量 推測統統計学では、母数 (parameter) と統計量 (statistic) とを明確に区別しているので、分析の際には注意する。

母数 (parameter)
* 母平均: \(μ\)(ミュー)— population mean
* 母比率: \(π\)(パイ)— population ratio
* 母分散: \(σ^2\) — population variance
* 母標準偏差: \(σ\)(シグマ)— population standard deviation

標本統計量 (statistic)
* 標本平均: \(\bar{x}\) — sample mean
* 標本比率: \(p\) — sample ratio
* 標本分散: \(s^2\) — sample variance
* 標本不偏分散: \(u_x^2\) — unbiased variance
* 標本標準偏差: \(s\) — sample variance
* 標本不偏標準偏差: \(u_x\) — unbiased standard deviation

サンプリングの方法
(1) 単純ランダム・サンプリング法 (simple random sampling):
* 偏りのない標本を選ぶ代表的な方法
* 単純無作為抽出された標本は、母集団の偏りのない縮図と見なせる
→ その標本を使って、母集団を推定できる

(2) 多段抽出法:
* 何段階かに分けて標本の抽出を行う方法
例)日本の有権者から1000人を標本として抽出する
1 段階: 市町村を無作為に選ぶ
2 段階: 選ばれた市町村から無作為に標本を選ぶ
* 母集団分布が広範囲に分布している場合に多段抽出法を使う

多段抽出法の一例・・・層化 2 段抽出
* 各市町村を大都市、中小都市、郡部と「層化」する
* 各層の大きさに応じたウェイ卜(例えば 3 : 2 : 1 ) をつけて市町村を無作為に選ぶ

【母平均 \(μ\) と標本平均 \(\bar{x}\) の関係】

dnorm()関数を使うと、母集団を人工的に作成でき、その分布密度を表示できる。

# 母平均 10、母標準偏差 5 と指定
# -10 から 30 の範囲を指定
curve(dnorm(x, 10, 5), from = -10, to = 30)