計量政治学のための確率論

P(A & male) = 0.05
P(A & female) = 0.25
P(B & male) = 0.1
P(B & female) = 0.1
P(C & male) = 0.1
P(C & female) = 0.1
P(F & male) = 0.25
P(F & female) = 0.05

条件付き確率

「A という条件のもとで、B が起きる確率」
例）「学生が女性という条件のもとで、彼女が成績 B を取る確率」

二つの事象 \(A, B\) について、\(A\) が起きたという条件のもとで \(B\) が起きる条件付き確率 \(P(B | A)\) は次の式で表せる。

\[P(B | A) = \frac{P(A∩B)}{P(A)}\]

つまり「A で条件付けしたときの B の条件付き確率」 = 「A と B が同時に起きる確率: P(A∩B)」を「A が起きる確率: P(A)」で割ったもの。

「計量政治学」を履修している履修者が男女半々ずついるとする。即ち、

\[P(male) = 0.5, P(female) = 0.5\]

「男性である」という条件のもとでのそれぞれの成績の実現確率は、

\[P(A|male) = 0.05/0.5 = 0.1\] \[P(B|male) = 0.1/0.5 = 0.2\] \[P(C|male) = 0.1/0.5 = 0.2\] \[P(F|male) = 0.25/0.5 = 0.5\]

「女性である」という条件のもとでのそれぞれの成績の実現確率は、

\[P(A|female) = 0.25/0.5 = 0.5\] \[P(B|female) = 0.1/0.5 = 0.2\] \[P(C|female) = 0.1/0.5 = 0.2\] \[P(F|female) = 0.05/0.5 = 0.1\]

男性であるという条件のもとで、B 以上の成績をとる確率は・・・0.1 + 0.2 = 0.3 (30%)
女性であるという条件のもとで、B 以上の成績をとる確率は・・・0.5 + 0.2 = 0.7 (70%)

この結果から、男性よりも女性の方が成績が良いことがわかる。

独立性

二つの事象の間に関係がない場合、それらの事象は「独立である」
二つの事象 A, B の確率について、

\[P(A ∩ B) = P(A)P(B)\]

であれば「事象 A と事象 B は独立である」独立性を条件付き確率で表すと、

\[P(B|A) = P(B)\]

つまり、「A の条件をつけても、B の起こりやすさは変わらない」= A と B は独立している
例えば、「計量政治学」の履修者の成績と性別の条件付き確率が次のように想定。

この場合、履修者の成績と性別の条件付き確率は、男女に関わらず同じ。
==> 履修者の成績と性別は確率的に独立。

離散確率変数

・起こりうる成績の事象: A, B, C, F
・それぞれの事象に数字を割り振る: A = 4, B = 3, C = 2, F = 1
・これらの四つの値を取り得る変数を X とすると
　==> X = 4 (A), X = 3 (B), X = 2 (C), X = 1 (F)
・A, B, C, F の成績をもらえる確率が 1/4だとすると
==> X = 1 となる確率は 1/4・・・変数のそれぞれの値が起きる確率割り振れる
・それぞれの数字が実現する確率が割り振られている変数 X = 確率変数
・「男性なら X = 1、女性ならば X = 0」と数字を割り振る ==> X は確率変数
・0 と 1 のように「飛び飛びの値」をとる場合 == 事象が「離散的」==> 離散確率変数

確率分布

離散確率分布

・確率変数・・・事象を数字で表し、その確率を割り振った変数
・確率関数・・・確率変数 (大文字の X) が特定の実現値 (小文字の x) をとる確率を与える関数

・「計量政治学」履修者の中から無作為に一人選んで、成績を聞く。
・成績に次のように数字を割り振る。

\[F = 1\] \[C = 2\] \[B = 3\] \[A = 4\]

・成績の確率変数 X は 1, 2, 3, 4 のいずれかの実現値を取る (X = 1, or 2, or 3, or 4) 離散確率変数
・履修者の 20% が A, 30% が B と C, そして 20% が F の成績だとする。
・たまたま選ばれた人の成績が X = 1 になる確率: P(X = 1) は 0.2。
・X の実現値それぞれの確率は次の様に表せる。

\[P(X=1) = 0.2\] \[P(X=2) = 0.3\] \[P(X=3) = 0.3\] \[P(X=4) = 0.2\]

・実現値 x に数字を入れず、

\[P(X = x)\]
と書くと「確率変数 X の実現値が x になる確率を与えてくれる関数」という意味
これは、次の様に表すこともある

\[P(X = x) = p_x(x)\]

離散的な確率変数とその確率変数の定義

・確率変数 X が M 個の離散的な値 \((x_1,...x_M)\) のいずれかにしかならないとき、X は「離散的確率変数」という。
・それぞれの値が実現する確率は、

\[p_X(x_1), ...p_X(x_M)\]

と表され、全ての \(i\) について

\[0 < P_X(x_i)≦1 (i = 1, 2, ..., M)\]

であり、\(p_X(x_i)\) の総和は次のように表す。

\[{\sum_{i=1}^M p_X(x_i) = 1}\]

・上記「計量政治学」履修者の例に当てはめてみる。
・確率変数 X は 1, 2, 3, 4 の 4 つの値のうちいずれかになるので M = 4 となる \((x_1 = 1, x_2 = 2 x_3 = 3, x_4 = 4)\)
・それぞれの値 \(x\) に対して、その値が実現する確率は\(p_X(x)\) で、それぞれの確率は必ず 0 より大きく 1 以下。
・それぞれの値が実現する確率は、

\[p_X(x_1) = 0.2\] \[p_X(x_2) = 0.3\] \[p_X(x_3) = 0.3\] \[p_X(x_4) = 0.2\]

となり、全ての確率を足し合わせると 1 になる。

\[p_X(x_1) + p_X(x_2) + p_X(x_3) + p_X(x_4) = 0.2 + 0.3 + 0.3 + 0.2 = 1\]

これを図で表すと次の様になる。

離散確率変数

確率変数 X の実現値が x になる確率を与えてくれる関数

累積分布関数

・この確率関数 \(p_X(x)\) を使うと、確率変数がある実現値「以下」になる確率を求めることができる。
・例えば「成績が C 以下」である確率は X が 1 か 2 になる確率: \(p_X(x_1) + p_X(x_2) = 0.5\)
・確率変数で表すと: \(P(X≦1)\)
・成績 C と F の確率を積み重ねるので累積分布関数

累積分布関数の定義
・離散確率変数 \(X\) の取り得る値を小さい順に \((x_1, x_2,...x_M)\) とすると、累積分布関数は、

\[F_X(x) = P(X≦x) = p_X(x_1) + ... + p_X(x_J)\]

となる。ただし、\(x_J ≦ x ≦ x_{J+1}\)

「計量政治学の成績」を図で表すと次の様になる。

累積分布関数

・全ての確率を足し合わせて累積すると 1 になることがわかる。

期待値

・確率変数と確率関数がわかった。
・次に、その確率変数が平均的にどのくらいの値をとるのか（=予測値）を知りたい。
・この予測値が期待値。

期待値の定義
・\((x_1,...x_M)\) の値をとりうる離散確率変数 \(X\) の確率関数を \(P_X(x)\) とすると、\(X\) の期待値\(E[X]\) は、

\[E[X] = x_1 × p_X(x_1) + ... + x_M × p_X(x_M) = \sum_{i=1}^M x_i × p_X(x_i) \]

離散確率変数 \(X\) の期待値 = [確率変数それぞれの実現値 \(x_i\) × その実現確率\(p_X(x_i)\)] の総和

・月々のバイト収入を確率変数 \(X\) とし、バイト収入の実現値は \(x\) = 10万円、5万円、0円。
・それぞれのバイト収入が実現する確率は次のとおり。

\[P(X=10) = 0.2\] \[P(X=5) = 0.3\] \[P(X=0) = 0.5\]

このときのバイト収入の期待値は、

\[E[X] = 10 × 0.2 + 5 × 0.3 + 0 × 0.5 = 3.5\]

「標本平均」と「期待値」の違い
・確率変数を使って計算した期待値と、標本データを使って計算した標本平均の間には一定の関係がある。
・標本平均・・・標本データだけを使って計算する
・期待値・・・データを生み出す母集団の確率分布を使って計算する。
・データから計算した「標本平均」は、母集団分布における期待値を推測するのに使う。
・計量政治学における統計的推論・・・標本平均から期待値を推測する作業。
・確率変数の期待値（＝平均）

確率変数の分散と標準偏差

確率変数の分散の定義

・\((x_1,...x_M)\) の値をとりうる離散確率変数 \(X\) の確率関数を \(P_X(x)\) とする。
・\(X\) の期待値 \(E[X] = μ（ミュー）\) とする。
・\(X\) の分散 \(V[X]\) は次の式で表せる。　　

\[V[X] = E[(X-μ)^2] = \sum_{i=1}^M(x_i - μ)^2 × p_X(x_i) \]

標準偏差は、\[{\sqrt{V[X]}}\] である。

離散確率変数 \(X\) の分散 = [確率変数 \(X\) のそれぞれの実現値 \(x_i\) と \(X\) の期待値 \(μ\) との距離の二乗] の期待値

・期待値から遠く離れた値が実現し、期待値から離れた値の実現確率が大きい ==> 分散が大きい

\[P(X=10) = 0.2\] \[P(X=5) = 0.3\] \[P(X=0) = 0.5\]

このときのバイト収入の期待値は 3.5なので、バイト収入の分散は、

\[V[X] = E[(X-μ)^2] = \sum_{i=1}^M(x_i - μ)^2 × p_X(x_i) \]

\[= (10 - 3.5)^2 × 0.2 + (5-3.5)^2 × 0.3 + (0-3.5)^2 × 0.5 = 9.125\]

標準偏差は、\[{\sqrt{V[X]}} = {\sqrt{9.125}} = 3.02\]

2つ以上の事柄の確率分布

同時確率関数

同時確率関数の定義

・2つの離散確率変数 \(X, Y\) のうち、\(X\) は \((x_1,...x_M)\) のいずれかをとり、\(Y\) は \(M_Y\) 個の離散的な \((y_1,...y_M)\) のいずれかをとるとする。
・\(X\) が \(X_i\) の値をとり、同時に \(Y\) が \(y_i\) の値をとる同時関数は、

\[P(X = x_i, Y = y_i) \]

と書く。

・離散確率変数 \(X, Y\) の同時確率関数を使うと、\(X\) と \(Y\) それぞれの確率関数は次のように表せる。

\[p_X(x) = \sum_{j=1}^{M_Y}p_{X,Y}(x, y_j) \]

\[p_Y(y) = \sum_{j=1}^{M_Y}p_{X,Y}(x_i, y) \]

確率変数の共分散

確率変数の共分散の定義

・離散確率変数 \(X\) は \((x_1,...x_{Mx})\) のいずれかの値をとる。
・離散確率変数 \(Y\) は \((y_1,...y_{My})\) のいずれかの値をとる。
・同時確率変数を \(p_{X,Y}(x, y)\) とする。
・\(X\) と \(Y\) の期待値をそれぞれ、

\[E[X] = μ_x\] \[E[Y] = μ_y\]

とすると、共分散 \(Cov[X, Y]\) は次のように表せる。

\[Cov[X, Y] = E[(X-μ_x)(Y-μ_y)]\]
\[=\sum_{i=1}^{M_X}\sum_{j=1}^{M_Y}(x_i-μ_X)(y_j-μ_Y)×p_{X,Y}(x_i, y_i) \]

・2つの確率変数が\(Cov[X, Y]\)同じ方向に動くとき・・・共分散 \(Cov[X, Y]\) は正の値
・2つの確率変数が\(Cov[X, Y]\)逆の方向に動くとき・・・共分散 \(Cov[X, Y]\) は負の値

・この共分散 \(Cov[X, Y]\) を、確率変数 \(X\) と \(Y\) それぞれの標準偏差で割ったのが相関係数。

相関係数の定義
・離散確率変数 \(X, Y\) の分散を \(V[X], V[Y]\)、共分散を \(Cov[X, Y]\) とすると、 \(X\) と \(Y\) の相関係数 \(p_{X, Y}\) は、

\[p_{X, Y}= \frac{Cov[X, Y]}{\sqrt{V[X]}\sqrt{V[Y]}}\]

「計量政治学の成績」と「統計入門履修の有無」との相関関係

・「計量政治学の成績」は（離散）確率変数 \(X\) とし、その実現値は次のとおり。

\[x = 1・・・(Grade: F)\] \[x = 2・・・(Grade: C)\] \[x = 3・・・(Grade: B)\] \[x = 4・・・(Grade: A)\]

・「計量政治学の成績」における確率を、確率変数 \(X\) を使うと次のように表せる。

\[P(X=1) = 0.2, P(X=2) = 0.3, P(X=3) = 0.3, P(=4) = 0.2\]

・「統計入門履修の有無」は（離散）確率変数 \(Y\) とし、その実現値は次のとおり。

\[y = 1・・・（履修済）\] \[y = 2・・・（未履修）\]

・「統計入門履修の有無」の確率を、確率変数 \(X\) を使うと次のように表せる。

\[P(X=1) = 0.5, P(X=2) = 0.5\]

・「統計入門履修の有無」と「計量政治学の成績」の同時確率を次のように想定。

\[P(X=1, Y=1) = 0, P(X=2, Y=1) = 0.1, P(X=3, Y=1) = 0.2, P(X=4, Y=1) = 0.2\] \[P(X=1, Y=2) = 0.2, P(X=2, Y=2) = 0.2, P(X=3, Y=2) = 0.1, P(X=4, Y=2) = 0\]

・これらを表にまとめると次の様になる。

・この時の \(X, Y\) の期待値は、

\[E[X] = x_1 × p_X(x_1) + ... + x_M × p_X(x_M) = \sum_{i=1}^M x_i × p_X(x_i) \]
\[= [1 × 0 + 1 × 0.2] + [2 × 0.1 + 2 × 0.2] + [3 × 0.2 + 3 × 0.1] + [4 × 0.2 + 4 × 0] = 2.5\]

\[E[Y] = y_1 × p_Y(y_1) + ... + y_M × p_Y(y_M) = \sum_{i=1}^M y_i × p_Y(y_i) \]
\[= [1 × 0 + 1 × 0.1 + 1 × 0.1 + 1 × 0.2] + [2 × 0.2 + 2 × 0.1 + 2 × 0.1 + 2 × 0] = 1.5\]

・この時の \(X, Y\) の共分散 \(Cov[X, Y]\) は、

\[Cov[X, Y] = E[(X-μ_x)(Y-μ_y)]\]
\[=\sum_{i=1}^{M_X}\sum_{j=1}^{M_Y}(x_i-μ_X)(y_j-μ_Y)×p_{X,Y}(x_i, y_i) \] \[=[(1-1.5)×(1-2.5)×0]+[(1-1.5)(2-2.5)×0.2]+[(1-1.5)(2-2.5)×0.2]+[(1-1.5)(3-2.5)×0.2]+ [(1-1.5)×(4-2.5)×0.2] + [(1-1.5)×(4-2.5)×0.2] \] \[+ [(2-1.5)×(1-2.5)×0.2]+[(2-1.5)(2-2.5)×0.2]+[(2-1.5)(3-2.5)×0.1]+[(2-1.5)(4-2.5)×0]=-0.525\]

\(X\) の分散 \(V[X]\) は、 \[V[X] = E[(X-μ)^2] = \sum_{i=1}^M(x_i - μ)^2 × p_X(x_i) \]

\[= (1-1.5)^2 × 0.5 + (2-1.5)^2 × 0.5 = 0.25\]

\(X\) の標準偏差は、\[{\sqrt{V[X]}} = {\sqrt{0.25}} = 0.5\]

\(Y\) の分散 \(V[Y]\) は、 \[V[Y] = E[(Y-μ)^2] = \sum_{i=1}^M(y_i - μ)^2 × p_Y(y_i) \]

\[= [(1-2.5)^2 × 0.2] + [(2-2.5)^2 × 0.3] +[(3-2.5)^2 × 0.3] + [(4-2.5)^2 × 0.2] = 1.65\]

\(Y\) の標準偏差は、\[{\sqrt{V[Y]}} = {\sqrt{1.65}} = 1.28\]

共分散 \(Cov[X, Y]\) は -0.35 だから、相関係数は、

\[p_{X, Y}= \frac{Cov[X, Y]}{\sqrt{V[X]}\sqrt{V[Y]}}\] \[= \frac{-0.525}{\sqrt{0.25}\sqrt{1.65}} = -0.82 \]

・ここでは「統計入門履修の有無」と「計量政治学の成績」との間には負の相関関係があることがわかる。

条件付期待値

・同時確率関数を使った条件付確率関数を使う利点
・確率変数 \(Y\) が \(y\) の値をとるという条件の下で => 確率変数 \(X\) が \(x\) の値を取る確率を求めることができる
・確率変数 \(Y\) が \(y\) の値をとるという条件の下で => 確率変数 \(X\) が \(x\) の値を取る期待値を求めることができる
・「ある政策を実施した（しない）という条件下それぞれの「期待値」（＝条件付期待値）を測定できる。
・二つの期待値の差を測定すれば、政策の「効果」がわかる。

条件付き確率関数の定義

・離散確率変数 \(X\) は \((x_1,...x_M)\) のいずれかの値をとる。
・離散確率変数 \(Y\) は \((y_1,...y_M)\) のいずれかの値をとる。
・\(Y = y_i\) という条件下での離散確率変数 \(X\) の条件付き確率関数 \(p_X(x|y_i)\) は、

\[p_X(x|y_i)= \frac{p_{X,Y}(x, y_i)}{p_Y(y_i)}\]

条件付き期待値の定義

・離散確率変数 \(X\) は \((x_1,...x_M)\) のいずれかの値をとる。
・離散確率変数 \(Y\) は \((y_1,...y_M)\) のいずれかの値をとる。
・\(Y = y_j\) という条件下での離散確率変数 \(X\) の条件付き期待値 \(E[X|Y=y_j]\) は、

\[E[X|Y=y_j]= x_i × p_X(x_1|y_j) + ... + x_{Mx} × p_X(x_{Mx} | y_j)=\sum_{i=1}^{M_x}x_i× p_X(x_i | y_j) \]

・条件の実現値をまだ決めていないときには、条件付き期待値は次のように表記される。
\[E[X | Y = y]\] \[E[X | y]\] \[E[X | Y]\]

「統計入門履修の有無」と「計量政治学の成績」の条件付き期待値を計算する
・計算のプロセス
(1) 条件付き確率 \(P(X/Y)\) を計算
(2) 条件付き期待値 \(E[X | Y = y_i]\) を計算

条件付き確率 \(P(X/Y)\) の計算 　

・「統計入門履修の有無」の実現値は次のように想定。

\[y = 1・・・履修済\] \[y = 2・・・未履修\]

・「計量政治学の成績」の実現値は次のように想定。

\[x = 1・・・(Grade: F)\] \[x = 2・・・(Grade: C)\] \[x = 3・・・(Grade: B)\] \[x = 4・・・(Grade: A)\]

・\(A\) が起きたという条件のもとで \(B\) が起きる条件付き確率 \(P(B | A)\) は次の式で表せる。

\[P(B | A) = \frac{P(A∩B)}{P(A)}\]

・「統計入門履修の有無」の確率（\(=P(A)\)）は、

\[P(Y=1) = 0.5, P(Y=2) = 0.5\]

・「統計入門履修の有無」と「計量政治学の成績」の同時確率（\({=P(A∩B)}\)）は次のように想定。

\[P(X=1, Y=1) = 0, P(X=2, Y=1) = 0.1, P(X=3, Y=1) = 0.2, P(X=4, Y=1) = 0.2\] \[P(X=1, Y=2) = 0.2, P(X=2, Y=2) = 0.2, P(X=3, Y=2) = 0.1, P(X=4, Y=2) = 0\]

【統計入門・・・履修済 \(Y=1\)】
・「統計入門を履修したという条件下（\(Y=1\)）での、計量政治学の成績が \(F(X = 1)\)の確率
\[P(X=1 | Y=1) = \frac{P(X=1, Y=1)}{P(Y=1)}=\frac{0}{0.5}=0\]

・「統計入門を履修したという条件下（\(Y=1\)）での、計量政治学の成績が \(C(X = 2)\)の確率
\[P(X=2 | Y=1) = \frac{P(X=2, Y=1)}{P(Y=1)}=\frac{0.1}{0.5}=0.5\]

・「統計入門を履修したという条件下（\(Y=1\)）での、計量政治学の成績が \(B(X = 3)\)の確率
\[P(X=3 | Y=1) = \frac{P(X=3, Y=1)}{P(Y=1)}=\frac{0.2}{0.5}=0.4\]

・「統計入門を履修したという条件下（\(Y=1\)）での、計量政治学の成績が \(A(X = 4)\)の確率
\[P(X=4 | Y=1) = \frac{P(X=4, Y=1)}{P(Y=1)}=\frac{0.2}{0.5}=0.4\]

【統計入門・・・未履修 \(Y=2\)】
・「統計入門を未履修という条件下（\(Y=2\)）での、計量政治学の成績が \(F(X = 1)\)の確率
\[P(X=1 | Y=2) = \frac{P(X=1, Y=2)}{P(Y=2)}=\frac{0.2}{0.5}=0.4\]

・「統計入門を未履修という条件下（\(Y=2\)）での、計量政治学の成績が \(C(X = 2)\)の確率
\[P(X=2 | Y=2) = \frac{P(X=2, Y=2)}{P(Y=2)}=\frac{0.2}{0.5}=0.4\]

・「統計入門を未履修という条件下（\(Y=2\)）での、計量政治学の成績が \(B(X = 3)\)の確率
\[P(X=3 | Y=2) = \frac{P(X=3, Y=2)}{P(Y=2)}=\frac{0.1}{0.5}=0.2\]

・「統計入門を未履修という条件下（\(Y=2\)）での、計量政治学の成績が \(A(X = 4)\)の確率
\[P(X=4 | Y=2) = \frac{P(X=4, Y=2)}{P(Y=2)}=\frac{0}{0.5}=0\]

条件付き期待値 \(E[X | Y = y_i]\) の計算 　

・\(Y = y_j\) という条件下での離散確率変数 \(X\) の条件付き期待値 \(E[X|Y=y_j]\) は、

\[E[X|Y=y_j]= x_i × p_X(x_1|y_j) + ... + y_{M_y} × p_X(x_{Mx} | y_j) =\sum_{j=1}^{M_x}x_i × p_X(x_i | y_j)\]

・「統計入門を履修という条件下 \(Y = 1\) での、計量政治学の成績の期待値: \(E[X | Y=1]\) は、 \[E[X|Y=y_1]= [1 × 0] + [2 × 0.1] + [3 × 0.2] + [4 × 0.2] = 1.6\]

・「統計入門を未履修という条件下 \(Y = 2\) での、計量政治学の成績の期待値: \(E[X | Y=2]\) は、 \[E[X|Y=y_2]= [1 × 0.2] + [2 × 0.2] + [3 × 0.1] + [4 × 0] = 0.9\]

結論・・・「統計入門」を履修した学生の方が、未履修の学生よりも平均的に高い GPA が期待される。

期待値の特徴

・\(a\) を定数、\(X\) と \(Y\) を確率変数とする。

\((1) E[a] = a\)

\((2) E[X+Y] = E[X] + E[Y]\)

\((3) X と Y が独立なら、E[XY] = E[X]E[Y]\)

\((4) E[aX] = aE[X]\)

条件付き期待値の特徴

・\(a\) を定数、\(X\) と \(Y\) を確率変数とする。

\((1) E[a | X] = a\)

\((2) E[X | X] = X\)

\((3) E[aX | X] = aX\)

\((4) E[X + Y | Z] = E[X | Z] + E[Y | Z]\)

\((5) E[X + Y | Z] = E[X | Z] + E[Y | Z]\)

\((6) E[E[X | Y]] = E[X]\)

条件付き分散

・離散確率変数 \(X\) は \((x_1,...x_M)\) のいずれかの値をとる。
・離散確率変数 \(Y\) は \((y_1,...y_M)\) のいずれかの値をとる。
・\(Y = y_j\) という条件下での離散確率変数 \(X\) の条件付き分散 \(E[X|Y=y_i]\) は、

\[V[X|Y=y_j]= (x_i-μ_X(y_j))^2 × p_X(x_1|y_j) + ... + (x_{Mx}-μ_X(y_i))^2 × p_x(x_{Mx} | y_j)=\sum_{i=1}^{M_x}(x_i-μ_X(y_j))^2 × p_X(x_i | y_j) \]

となる。

ただし、\(μ_X(y_j)\) は \(Y = y_j\) の時の \(X\) の条件付き期待値

\[μ_X(y_j) = E[X | Y = y_j]\]

である。
・条件の実現値をまだ決めていないときには、条件付き期待値は次のように表記される。
\[V[X | Y = y]\] \[V[X | y]\] \[V[X | Y]\]

連続確率分布

・連続変数について確率を考えるときには
・確率変数の範囲を使う。
・確率変数 \(X\) が 0 から 10 いずれかの値を連続的にとるとする。
・確率変数 \(X\) が円周率 \(π = 3.14\) をとる確率はゼロ。
・しかし、確率変数 \(X\) が円周率 \(π\) の ±1 の範囲を取る確率はゼロではない。
==> 累積分布関数と関連

・確率密度関数（＝確率変数 \(X\) が \(x\) となる確率密度を表す関数）は \(f(x)\) と表す。
・累積分布関数（＝確率変数 \(X\) が \(x\) 以下となる確率を表す関数）は \(F(x)\) と表す。
・連続確率変数の場合、確率密度関数と \(x\) 軸で挟まれた部分の面積が必ず 1 になる。　　

累積分布関数

累積分布関数の定義
・確率変数 \(X\) に対して累積分布関数は、

\[F_X(x) = P(X≦x)\]

である。特に確率変数 \(X\) が \(a\) より大きく \(b\) 以下の区間に入る確率は、

\[P(a < X ≦ b) = F_X(b) - F_X(a)\]

となる。

確率密度関数

・累積分布関数 \(F(x)\) を使うと、確率変数 \(X\) の実現値がある値 \(x\) 以下になる確率がわかる。
・\(x\) が増えると、累積分布関数の値も増える。
・\(x\) が「ほんの少しだけ」増えたとき、累積分布関数の値が「大きく」増えた
==> もとの \(x\) から新たに増えた \(x\) までの範囲の値が実現しやすい
・\(x\) が増えたときの累積分布関数の値の増え方（増加率） = 確率密度関数: \(f(x)\)

確率密度関数の定義
・\(x\) の微少な増加分を \(Δx (>0)\) とする
・\(a=x, b =x + Δx\) とする
・確率変数 \(X\) の実現値が \(a\) より大きく \(b\) 以下の範囲に入る確率は、

\[F_X(x+Δx) - F_X(x)\]

・この累積分布関数の増加分を \(x\) の増加分 \(Δx\) で割れば、累積分布関数の増加率が得られる。

\[f_X(x)= \frac{F_X(x+Δx)-F_X(x)}{Δx}\]

・この \(x\) の増加分 \(Δx\) を限りなく 0 に近づけたものが確率密度関数: \(f(x)\)

・確率密度関数 \(f(x)\) は累積分布関数 \(F(x)\) を微分したもの。

・確率変数が連続の場合でも、確率密度関数や累積分布関数を使うと、離散確率変数の場合と同じように期待値、分散、条件付き確率、条件付き期待値を計算できる。

計量政治学のための確率論

Masahiko Asano

March 9, 2017

確率

確率・事象・標本空間

同時確率

条件付き確率

独立性

離散確率変数

確率分布

離散確率分布

累積分布関数

期待値

確率変数の分散と標準偏差

2つ以上の事柄の確率分布

同時確率関数

確率変数の共分散

条件付期待値

期待値の特徴

条件付き期待値の特徴

条件付き分散

連続確率分布

累積分布関数

確率密度関数

References