• 確率
  • 確率分布
  • 2つ以上の事柄の確率分布
  • 連続確率分布
  • 確率

    確率・事象・標本空間

    確率・・・ある現象(=事象)がどの程度「確からしい」のかを 0 から 1 の数字で表したもの。
    標本空間・・・起こりうる全ての事象をまとめたもの

    例)大学の授業の成績: A, B, C, F
    成績 A = 起こりうるひとつの「事象」
    成績 A, B, C, F = 起こりうる全ての事象をまとめた「標本空間」
    この四つの事象が起きる「確からしさ」がすべて同じなら ==> A, B, C, F それぞれの確率は 1/4

    「計量政治学」の履修学生の成績は、必ず次の 4 つの事象のどれかに当てはまる。

    事象:A, B, C, F 

    これら四つの事象は成績の全てを網羅しているので、

    標本空間 = (A, B, C, F)

    「計量政治学」の履修学生の 15% が A の成績、30% が B の成績、30% が C の成績、15% が F の成績だとすると、ある学生の成績が四つの事象のいずれかになる確率 P は、

    \[P(A) = 0.15\] \[P(B) = 0.3\] \[P(C) = 0.3\] \[P(F) = 0.15\]

    確率の公理
    (1) 0 ≦ 事象が起きる確率 ≦ 1
    (2) 標本空間の事象のうち、いずれかが起きる確率は 1
    (3) 排反事象の和事象が起きる確率 = それぞれの事象が起きる確率の和

    ・「成績が C 以上」の和事象について (3) が満たされているかどうか

    「成績が C 以上」という事象の起きる確率は、

    \[P(A) + P(B) + P(C) = 0.15 + 0.3 + 0.3 = 0.75\]

    同時確率

    「二つの事象 A と B が同時に起こる」事象 = 「A と B の積事象」: P(A ∩ B)
    「計量政治学」を履修している学生の成績と男女の事象が同時に起きる確率は次の様に表せる。

    P(A & male) = 0.05
    P(A & female) = 0.25
    P(B & male) = 0.1
    P(B & female) = 0.1
    P(C & male) = 0.1
    P(C & female) = 0.1
    P(F & male) = 0.25
    P(F & female) = 0.05

    条件付き確率

    「A という条件のもとで、B が起きる確率」
    例)「学生が女性という条件のもとで、彼女が成績 B を取る確率」

    二つの事象 \(A, B\) について、\(A\) が起きたという条件のもとで \(B\) が起きる条件付き確率 \(P(B | A)\) は次の式で表せる。

    \[P(B | A) = \frac{P(A∩B)}{P(A)}\]

    つまり「A で条件付けしたときの B の条件付き確率」 = 「A と B が同時に起きる確率: P(A∩B)」を「A が起きる確率: P(A)」で割ったもの。

    「計量政治学」を履修している履修者が男女半々ずついるとする。即ち、

    \[P(male) = 0.5, P(female) = 0.5\]

    「男性である」という条件のもとでのそれぞれの成績の実現確率は、

    \[P(A|male) = 0.05/0.5 = 0.1\] \[P(B|male) = 0.1/0.5 = 0.2\] \[P(C|male) = 0.1/0.5 = 0.2\] \[P(F|male) = 0.25/0.5 = 0.5\]

    「女性である」という条件のもとでのそれぞれの成績の実現確率は、

    \[P(A|female) = 0.25/0.5 = 0.5\] \[P(B|female) = 0.1/0.5 = 0.2\] \[P(C|female) = 0.1/0.5 = 0.2\] \[P(F|female) = 0.05/0.5 = 0.1\]

    男性であるという条件のもとで、B 以上の成績をとる確率は・・・0.1 + 0.2 = 0.3 (30%)
    女性であるという条件のもとで、B 以上の成績をとる確率は・・・0.5 + 0.2 = 0.7 (70%)

    この結果から、男性よりも女性の方が成績が良いことがわかる。

    独立性

    二つの事象の間に関係がない場合、それらの事象は「独立である」
    二つの事象 A, B の確率について、

    \[P(A ∩ B) = P(A)P(B)\]

    であれば「事象 A と事象 B は独立である」 独立性を条件付き確率で表すと、

    \[P(B|A) = P(B)\]

    つまり、「A の条件をつけても、B の起こりやすさは変わらない」= A と B は独立している
    例えば、「計量政治学」の履修者の成績と性別の条件付き確率が次のように想定。

    \[P(A|male) = P(A|female) = P(A) = 0.2\] \[P(B|male) = P(B|female) = P(B) = 0.3\] \[P(C|male) = P(C|female) = P(C) = 0.3\] \[P(F|male) = P(F|female) = P(F) = 0.2\]

    この場合、履修者の成績と性別の条件付き確率は、男女に関わらず同じ。
    ==> 履修者の成績と性別は確率的に独立。

    離散確率変数

    ・起こりうる成績の事象: A, B, C, F
    ・それぞれの事象に数字を割り振る: A = 4, B = 3, C = 2, F = 1
    ・これらの四つの値を取り得る変数を X とすると
     ==> X = 4 (A), X = 3 (B), X = 2 (C), X = 1 (F)
    ・A, B, C, F の成績をもらえる確率が 1/4だとすると
    ==> X = 1 となる確率は 1/4・・・変数のそれぞれの値が起きる確率割り振れる
    ・それぞれの数字が実現する確率が割り振られている変数 X = 確率変数
    ・「男性なら X = 1、女性ならば X = 0」と数字を割り振る ==> X は確率変数
    ・0 と 1 のように「飛び飛びの値」をとる場合 == 事象が「離散的」==> 離散確率変数

    確率分布

    離散確率分布

    ・確率変数・・・事象を数字で表し、その確率を割り振った変数
    ・確率関数・・・確率変数 (大文字の X) が特定の実現値 (小文字の x) をとる確率を与える関数

    ・「計量政治学」履修者の中から無作為に一人選んで、成績を聞く。
    ・成績に次のように数字を割り振る。

    \[F = 1\] \[C = 2\] \[B = 3\] \[A = 4\]

    ・成績の確率変数 X は 1, 2, 3, 4 のいずれかの実現値を取る (X = 1, or 2, or 3, or 4) 離散確率変数
    ・履修者の 20% が A, 30% が B と C, そして 20% が F の成績だとする。
    ・たまたま選ばれた人の成績が X = 1 になる確率: P(X = 1) は 0.2。
    ・X の実現値それぞれの確率は次の様に表せる。

    \[P(X=1) = 0.2\] \[P(X=2) = 0.3\] \[P(X=3) = 0.3\] \[P(X=4) = 0.2\]

    ・実現値 x に数字を入れず、

    \[P(X = x)\]
    と書くと「確率変数 X の実現値が x になる確率を与えてくれる関数」という意味
    これは、次の様に表すこともある

    \[P(X = x) = p_x(x)\]

    離散的な確率変数とその確率変数の定義

    ・確率変数 X が M 個の離散的な値 \((x_1,...x_M)\) のいずれかにしかならないとき、X は「離散的確率変数」という。
    ・それぞれの値が実現する確率は、

    \[p_X(x_1), ...p_X(x_M)\]

    と表され、全ての \(i\) について

    \[0 < P_X(x_i)≦1 (i = 1, 2, ..., M)\]

    であり、\(p_X(x_i)\) の総和は次のように表す。

    \[{\sum_{i=1}^M p_X(x_i) = 1}\]

    ・上記「計量政治学」履修者の例に当てはめてみる。
    ・確率変数 X は 1, 2, 3, 4 の 4 つの値のうちいずれかになるので M = 4 となる \((x_1 = 1, x_2 = 2 x_3 = 3, x_4 = 4)\)
    ・それぞれの値 \(x\) に対して、その値が実現する確率は\(p_X(x)\) で、それぞれの確率は必ず 0 より大きく 1 以下。
    ・それぞれの値が実現する確率は、

    \[p_X(x_1) = 0.2\] \[p_X(x_2) = 0.3\] \[p_X(x_3) = 0.3\] \[p_X(x_4) = 0.2\]

    となり、全ての確率を足し合わせると 1 になる。

    \[p_X(x_1) + p_X(x_2) + p_X(x_3) + p_X(x_4) = 0.2 + 0.3 + 0.3 + 0.2 = 1\]

    これを図で表すと次の様になる。


    離散確率変数

    確率変数 X の実現値が x になる確率を与えてくれる関数

    累積分布関数

    ・この確率関数 \(p_X(x)\) を使うと、確率変数がある実現値「以下」になる確率を求めることができる。
    ・例えば「成績が C 以下」である確率は X が 1 か 2 になる確率: \(p_X(x_1) + p_X(x_2) = 0.5\)
    ・確率変数で表すと: \(P(X≦1)\)
    ・成績 C と F の確率を積み重ねるので累積分布関数

    累積分布関数の定義
    ・離散確率変数 \(X\) の取り得る値を小さい順に \((x_1, x_2,...x_M)\) とすると、累積分布関数は、

    \[F_X(x) = P(X≦x) = p_X(x_1) + ... + p_X(x_J)\]

    となる。ただし、\(x_J ≦ x ≦ x_{J+1}\)

    「計量政治学の成績」を図で表すと次の様になる。


    累積分布関数

    ・全ての確率を足し合わせて累積すると 1 になることがわかる。

    期待値

    ・確率変数と確率関数がわかった。
    ・次に、その確率変数が平均的にどのくらいの値をとるのか(=予測値)を知りたい。
    ・この予測値が期待値

    期待値の定義
    \((x_1,...x_M)\) の値をとりうる離散確率変数 \(X\) の確率関数を \(P_X(x)\) とすると、\(X\) の期待値\(E[X]\) は、

    \[E[X] = x_1 × p_X(x_1) + ... + x_M × p_X(x_M) = \sum_{i=1}^M x_i × p_X(x_i) \]

    離散確率変数 \(X\) の期待値 = [確率変数それぞれの実現値 \(x_i\) × その実現確率\(p_X(x_i)\)] の総和

    ・月々のバイト収入を確率変数 \(X\) とし、バイト収入の実現値は \(x\) = 10万円、5万円、0円。
    ・それぞれのバイト収入が実現する確率は次のとおり。

    \[P(X=10) = 0.2\] \[P(X=5) = 0.3\] \[P(X=0) = 0.5\]

    このときのバイト収入の期待値は、

    \[E[X] = 10 × 0.2 + 5 × 0.3 + 0 × 0.5 = 3.5\]

    「標本平均」と「期待値」の違い
    ・確率変数を使って計算した期待値と、標本データを使って計算した標本平均の間には一定の関係がある。
    ・標本平均・・・標本データだけを使って計算する
    ・期待値・・・データを生み出す母集団の確率分布を使って計算する。
    ・データから計算した「標本平均」は、母集団分布における期待値を推測するのに使う。
    ・計量政治学における統計的推論・・・標本平均から期待値を推測する作業。
    ・確率変数の期待値(=平均)

    確率変数の分散と標準偏差

    確率変数の分散の定義

    \((x_1,...x_M)\) の値をとりうる離散確率変数 \(X\) の確率関数を \(P_X(x)\) とする。
    \(X\) の期待値 \(E[X] = μ(ミュー)\) とする。
    \(X\) の分散 \(V[X]\) は次の式で表せる。  

    \[V[X] = E[(X-μ)^2] = \sum_{i=1}^M(x_i - μ)^2 × p_X(x_i) \]

    標準偏差は、\[{\sqrt{V[X]}}\] である。

    離散確率変数 \(X\) の分散 = [確率変数 \(X\) のそれぞれの実現値 \(x_i\)\(X\) の期待値 \(μ\) との距離の二乗] の期待値

    ・期待値から遠く離れた値が実現し、期待値から離れた値の実現確率が大きい ==> 分散が大きい

    ・月々のバイト収入を確率変数 \(X\) とし、バイト収入の実現値は \(x\) = 10万円、5万円、0円。
    ・それぞれのバイト収入が実現する確率は次のとおり。

    \[P(X=10) = 0.2\] \[P(X=5) = 0.3\] \[P(X=0) = 0.5\]

    このときのバイト収入の期待値は 3.5なので、バイト収入の分散は、

    \[V[X] = E[(X-μ)^2] = \sum_{i=1}^M(x_i - μ)^2 × p_X(x_i) \]

    \[= (10 - 3.5)^2 × 0.2 + (5-3.5)^2 × 0.3 + (0-3.5)^2 × 0.5 = 9.125\]

    標準偏差は、\[{\sqrt{V[X]}} = {\sqrt{9.125}} = 3.02\]

    2つ以上の事柄の確率分布

    同時確率関数

    同時確率関数の定義

    ・2つの離散確率変数 \(X, Y\) のうち、\(X\)\((x_1,...x_M)\) のいずれかをとり、\(Y\)\(M_Y\) 個の離散的な \((y_1,...y_M)\) のいずれかをとるとする。
    \(X\)\(X_i\) の値をとり、同時に \(Y\)\(y_i\) の値をとる同時関数は、

    \[P(X = x_i, Y = y_i) \]

    と書く。

    ・離散確率変数 \(X, Y\) の同時確率関数を使うと、\(X\)\(Y\) それぞれの確率関数は次のように表せる。

    \[p_X(x) = \sum_{j=1}^{M_Y}p_{X,Y}(x, y_j) \]

    \[p_Y(y) = \sum_{j=1}^{M_Y}p_{X,Y}(x_i, y) \]

    確率変数の共分散

    確率変数の共分散の定義

    ・離散確率変数 \(X\)\((x_1,...x_{Mx})\) のいずれかの値をとる。
    ・離散確率変数 \(Y\)\((y_1,...y_{My})\) のいずれかの値をとる。
    ・同時確率変数を \(p_{X,Y}(x, y)\) とする。
    \(X\)\(Y\) の期待値をそれぞれ、

    \[E[X] = μ_x\] \[E[Y] = μ_y\]

    とすると、共分散 \(Cov[X, Y]\) は次のように表せる。

    \[Cov[X, Y] = E[(X-μ_x)(Y-μ_y)]\]
    \[=\sum_{i=1}^{M_X}\sum_{j=1}^{M_Y}(x_i-μ_X)(y_j-μ_Y)×p_{X,Y}(x_i, y_i) \]

    ・2つの確率変数が\(Cov[X, Y]\)同じ方向に動くとき・・・共分散 \(Cov[X, Y]\)の値
    ・2つの確率変数が\(Cov[X, Y]\)逆の方向に動くとき・・・共分散 \(Cov[X, Y]\)の値

    ・この共分散 \(Cov[X, Y]\) を、確率変数 \(X\)\(Y\) それぞれの標準偏差で割ったのが相関係数。

    相関係数の定義
    ・離散確率変数 \(X, Y\) の分散を \(V[X], V[Y]\)、共分散を \(Cov[X, Y]\) とすると、 \(X\)\(Y\) の相関係数 \(p_{X, Y}\) は、

    \[p_{X, Y}= \frac{Cov[X, Y]}{\sqrt{V[X]}\sqrt{V[Y]}}\]

    「計量政治学の成績」と「統計入門履修の有無」との相関関係

    ・「計量政治学の成績」は(離散)確率変数 \(X\) とし、その実現値は次のとおり。

    \[x = 1・・・(Grade: F)\] \[x = 2・・・(Grade: C)\] \[x = 3・・・(Grade: B)\] \[x = 4・・・(Grade: A)\]

    ・「計量政治学の成績」における確率を、確率変数 \(X\) を使うと次のように表せる。

    \[P(X=1) = 0.2, P(X=2) = 0.3, P(X=3) = 0.3, P(=4) = 0.2\]

    ・「統計入門履修の有無」は(離散)確率変数 \(Y\) とし、その実現値は次のとおり。

    \[y = 1・・・(履修済)\] \[y = 2・・・(未履修)\]

    ・「統計入門履修の有無」の確率を、確率変数 \(X\) を使うと次のように表せる。

    \[P(X=1) = 0.5, P(X=2) = 0.5\]

    ・「統計入門履修の有無」と「計量政治学の成績」の同時確率を次のように想定。

    \[P(X=1, Y=1) = 0, P(X=2, Y=1) = 0.1, P(X=3, Y=1) = 0.2, P(X=4, Y=1) = 0.2\] \[P(X=1, Y=2) = 0.2, P(X=2, Y=2) = 0.2, P(X=3, Y=2) = 0.1, P(X=4, Y=2) = 0\]

    ・これらを表にまとめると次の様になる。