確率・・・ある現象(=事象)がどの程度「確からしい」のかを 0 から 1 の数字で表したもの。
標本空間・・・起こりうる全ての事象をまとめたもの
例)大学の授業の成績: A, B, C, F
成績 A = 起こりうるひとつの「事象」
成績 A, B, C, F = 起こりうる全ての事象をまとめた「標本空間」
この四つの事象が起きる「確からしさ」がすべて同じなら ==> A, B, C, F それぞれの確率は 1/4
事象:A, B, C, F
標本空間 = (A, B, C, F)
「計量政治学」の履修学生の 15% が A の成績、30% が B の成績、30% が C の成績、15% が F の成績だとすると、ある学生の成績が四つの事象のいずれかになる確率 P は、
\[P(A) = 0.15\] \[P(B) = 0.3\] \[P(C) = 0.3\] \[P(F) = 0.15\]
確率の公理
(1) 0 ≦ 事象が起きる確率 ≦ 1
(2) 標本空間の事象のうち、いずれかが起きる確率は 1
(3) 排反事象の和事象が起きる確率 = それぞれの事象が起きる確率の和
・「成績が C 以上」の和事象について (3) が満たされているかどうか
「成績が C 以上」という事象の起きる確率は、
\[P(A) + P(B) + P(C) = 0.15 + 0.3 + 0.3 = 0.75\]
「二つの事象 A と B が同時に起こる」事象 = 「A と B の積事象」: P(A ∩ B)
「計量政治学」を履修している学生の成績と男女の事象が同時に起きる確率は次の様に表せる。
P(A & male) = 0.05
P(A & female) = 0.25
P(B & male) = 0.1
P(B & female) = 0.1
P(C & male) = 0.1
P(C & female) = 0.1
P(F & male) = 0.25
P(F & female) = 0.05
「A という条件のもとで、B が起きる確率」
例)「学生が女性という条件のもとで、彼女が成績 B を取る確率」
二つの事象 \(A, B\) について、\(A\) が起きたという条件のもとで \(B\) が起きる条件付き確率 \(P(B | A)\) は次の式で表せる。
\[P(B | A) = \frac{P(A∩B)}{P(A)}\]
つまり「A で条件付けしたときの B の条件付き確率」 = 「A と B が同時に起きる確率: P(A∩B)」を「A が起きる確率: P(A)」で割ったもの。
「計量政治学」を履修している履修者が男女半々ずついるとする。即ち、
\[P(male) = 0.5, P(female) = 0.5\]
「男性である」という条件のもとでのそれぞれの成績の実現確率は、
\[P(A|male) = 0.05/0.5 = 0.1\] \[P(B|male) = 0.1/0.5 = 0.2\] \[P(C|male) = 0.1/0.5 = 0.2\] \[P(F|male) = 0.25/0.5 = 0.5\]
「女性である」という条件のもとでのそれぞれの成績の実現確率は、
\[P(A|female) = 0.25/0.5 = 0.5\] \[P(B|female) = 0.1/0.5 = 0.2\] \[P(C|female) = 0.1/0.5 = 0.2\] \[P(F|female) = 0.05/0.5 = 0.1\]
男性であるという条件のもとで、B 以上の成績をとる確率は・・・0.1 + 0.2 = 0.3 (30%)
女性であるという条件のもとで、B 以上の成績をとる確率は・・・0.5 + 0.2 = 0.7 (70%)
この結果から、男性よりも女性の方が成績が良いことがわかる。
二つの事象の間に関係がない場合、それらの事象は「独立である」
二つの事象 A, B の確率について、
\[P(A ∩ B) = P(A)P(B)\]
であれば「事象 A と事象 B は独立である」 独立性を条件付き確率で表すと、
\[P(B|A) = P(B)\]
つまり、「A の条件をつけても、B の起こりやすさは変わらない」= A と B は独立している
例えば、「計量政治学」の履修者の成績と性別の条件付き確率が次のように想定。
\[P(A|male) = P(A|female) = P(A) = 0.2\] \[P(B|male) = P(B|female) = P(B) = 0.3\] \[P(C|male) = P(C|female) = P(C) = 0.3\] \[P(F|male) = P(F|female) = P(F) = 0.2\]
この場合、履修者の成績と性別の条件付き確率は、男女に関わらず同じ。
==> 履修者の成績と性別は確率的に独立。
・起こりうる成績の事象: A, B, C, F
・それぞれの事象に数字を割り振る: A = 4, B = 3, C = 2, F = 1
・これらの四つの値を取り得る変数を X とすると
==> X = 4 (A), X = 3 (B), X = 2 (C), X = 1 (F)
・A, B, C, F の成績をもらえる確率が 1/4だとすると
==> X = 1 となる確率は 1/4・・・変数のそれぞれの値が起きる確率割り振れる
・それぞれの数字が実現する確率が割り振られている変数 X = 確率変数
・「男性なら X = 1、女性ならば X = 0」と数字を割り振る ==> X は確率変数
・0 と 1 のように「飛び飛びの値」をとる場合 == 事象が「離散的」==> 離散確率変数
・確率変数・・・事象を数字で表し、その確率を割り振った変数
・確率関数・・・確率変数 (大文字の X) が特定の実現値 (小文字の x) をとる確率を与える関数
・「計量政治学」履修者の中から無作為に一人選んで、成績を聞く。
・成績に次のように数字を割り振る。
\[F = 1\] \[C = 2\] \[B = 3\] \[A = 4\]
・成績の確率変数 X は 1, 2, 3, 4 のいずれかの実現値を取る (X = 1, or 2, or 3, or 4) 離散確率変数
・履修者の 20% が A, 30% が B と C, そして 20% が F の成績だとする。
・たまたま選ばれた人の成績が X = 1 になる確率: P(X = 1) は 0.2。
・X の実現値それぞれの確率は次の様に表せる。
\[P(X=1) = 0.2\] \[P(X=2) = 0.3\] \[P(X=3) = 0.3\] \[P(X=4) = 0.2\]
・実現値 x に数字を入れず、
\[P(X = x)\]
と書くと「確率変数 X の実現値が x になる確率を与えてくれる関数」という意味
これは、次の様に表すこともある
\[P(X = x) = p_x(x)\]
離散的な確率変数とその確率変数の定義
・確率変数 X が M 個の離散的な値 \((x_1,...x_M)\) のいずれかにしかならないとき、X は「離散的確率変数」という。
・それぞれの値が実現する確率は、
\[p_X(x_1), ...p_X(x_M)\]
と表され、全ての \(i\) について
\[0 < P_X(x_i)≦1 (i = 1, 2, ..., M)\]
であり、\(p_X(x_i)\) の総和は次のように表す。
\[{\sum_{i=1}^M p_X(x_i) = 1}\]
・上記「計量政治学」履修者の例に当てはめてみる。
・確率変数 X は 1, 2, 3, 4 の 4 つの値のうちいずれかになるので M = 4 となる \((x_1 = 1, x_2 = 2 x_3 = 3, x_4 = 4)\)
・それぞれの値 \(x\) に対して、その値が実現する確率は\(p_X(x)\) で、それぞれの確率は必ず 0 より大きく 1 以下。
・それぞれの値が実現する確率は、
\[p_X(x_1) = 0.2\] \[p_X(x_2) = 0.3\] \[p_X(x_3) = 0.3\] \[p_X(x_4) = 0.2\]
となり、全ての確率を足し合わせると 1 になる。
\[p_X(x_1) + p_X(x_2) + p_X(x_3) + p_X(x_4) = 0.2 + 0.3 + 0.3 + 0.2 = 1\]
これを図で表すと次の様になる。
離散確率変数
・この確率関数 \(p_X(x)\) を使うと、確率変数がある実現値「以下」になる確率を求めることができる。
・例えば「成績が C 以下」である確率は X が 1 か 2 になる確率: \(p_X(x_1) + p_X(x_2) = 0.5\)
・確率変数で表すと: \(P(X≦1)\)
・成績 C と F の確率を積み重ねるので累積分布関数
累積分布関数の定義
・離散確率変数 \(X\) の取り得る値を小さい順に \((x_1, x_2,...x_M)\) とすると、累積分布関数は、
\[F_X(x) = P(X≦x) = p_X(x_1) + ... + p_X(x_J)\]
となる。ただし、\(x_J ≦ x ≦ x_{J+1}\)
「計量政治学の成績」を図で表すと次の様になる。
累積分布関数
・全ての確率を足し合わせて累積すると 1 になることがわかる。
・確率変数と確率関数がわかった。
・次に、その確率変数が平均的にどのくらいの値をとるのか(=予測値)を知りたい。
・この予測値が期待値。
期待値の定義
・\((x_1,...x_M)\) の値をとりうる離散確率変数 \(X\) の確率関数を \(P_X(x)\) とすると、\(X\) の期待値\(E[X]\) は、
\[E[X] = x_1 × p_X(x_1) + ... + x_M × p_X(x_M) = \sum_{i=1}^M x_i × p_X(x_i) \]
離散確率変数 \(X\) の期待値 = [確率変数それぞれの実現値 \(x_i\) × その実現確率\(p_X(x_i)\)] の総和
・月々のバイト収入を確率変数 \(X\) とし、バイト収入の実現値は \(x\) = 10万円、5万円、0円。
・それぞれのバイト収入が実現する確率は次のとおり。
\[P(X=10) = 0.2\] \[P(X=5) = 0.3\] \[P(X=0) = 0.5\]
このときのバイト収入の期待値は、
\[E[X] = 10 × 0.2 + 5 × 0.3 + 0 × 0.5 = 3.5\]
「標本平均」と「期待値」の違い
・確率変数を使って計算した期待値と、標本データを使って計算した標本平均の間には一定の関係がある。
・標本平均・・・標本データだけを使って計算する
・期待値・・・データを生み出す母集団の確率分布を使って計算する。
・データから計算した「標本平均」は、母集団分布における期待値を推測するのに使う。
・計量政治学における統計的推論・・・標本平均から期待値を推測する作業。
・確率変数の期待値(=平均)
確率変数の分散の定義
・\((x_1,...x_M)\) の値をとりうる離散確率変数 \(X\) の確率関数を \(P_X(x)\) とする。
・\(X\) の期待値 \(E[X] = μ(ミュー)\) とする。
・\(X\) の分散 \(V[X]\) は次の式で表せる。
\[V[X] = E[(X-μ)^2] = \sum_{i=1}^M(x_i - μ)^2 × p_X(x_i) \]
標準偏差は、\[{\sqrt{V[X]}}\] である。
離散確率変数 \(X\) の分散 = [確率変数 \(X\) のそれぞれの実現値 \(x_i\) と \(X\) の期待値 \(μ\) との距離の二乗] の期待値
・期待値から遠く離れた値が実現し、期待値から離れた値の実現確率が大きい ==> 分散が大きい
・月々のバイト収入を確率変数 \(X\) とし、バイト収入の実現値は \(x\) = 10万円、5万円、0円。
・それぞれのバイト収入が実現する確率は次のとおり。
\[P(X=10) = 0.2\] \[P(X=5) = 0.3\] \[P(X=0) = 0.5\]
このときのバイト収入の期待値は 3.5なので、バイト収入の分散は、
\[V[X] = E[(X-μ)^2] = \sum_{i=1}^M(x_i - μ)^2 × p_X(x_i) \]
\[= (10 - 3.5)^2 × 0.2 + (5-3.5)^2 × 0.3 + (0-3.5)^2 × 0.5 = 9.125\]
標準偏差は、\[{\sqrt{V[X]}} = {\sqrt{9.125}} = 3.02\]
同時確率関数の定義
・2つの離散確率変数 \(X, Y\) のうち、\(X\) は \((x_1,...x_M)\) のいずれかをとり、\(Y\) は \(M_Y\) 個の離散的な \((y_1,...y_M)\) のいずれかをとるとする。
・\(X\) が \(X_i\) の値をとり、同時に \(Y\) が \(y_i\) の値をとる同時関数は、
\[P(X = x_i, Y = y_i) \]
と書く。
・離散確率変数 \(X, Y\) の同時確率関数を使うと、\(X\) と \(Y\) それぞれの確率関数は次のように表せる。
\[p_X(x) = \sum_{j=1}^{M_Y}p_{X,Y}(x, y_j) \]
\[p_Y(y) = \sum_{j=1}^{M_Y}p_{X,Y}(x_i, y) \]
確率変数の共分散の定義
・離散確率変数 \(X\) は \((x_1,...x_{Mx})\) のいずれかの値をとる。
・離散確率変数 \(Y\) は \((y_1,...y_{My})\) のいずれかの値をとる。
・同時確率変数を \(p_{X,Y}(x, y)\) とする。
・\(X\) と \(Y\) の期待値をそれぞれ、
\[E[X] = μ_x\] \[E[Y] = μ_y\]
とすると、共分散 \(Cov[X, Y]\) は次のように表せる。
\[Cov[X, Y] = E[(X-μ_x)(Y-μ_y)]\]
\[=\sum_{i=1}^{M_X}\sum_{j=1}^{M_Y}(x_i-μ_X)(y_j-μ_Y)×p_{X,Y}(x_i, y_i) \]
・2つの確率変数が\(Cov[X, Y]\)同じ方向に動くとき・・・共分散 \(Cov[X, Y]\) は正の値
・2つの確率変数が\(Cov[X, Y]\)逆の方向に動くとき・・・共分散 \(Cov[X, Y]\) は負の値
・この共分散 \(Cov[X, Y]\) を、確率変数 \(X\) と \(Y\) それぞれの標準偏差で割ったのが相関係数。
相関係数の定義
・離散確率変数 \(X, Y\) の分散を \(V[X], V[Y]\)、共分散を \(Cov[X, Y]\) とすると、 \(X\) と \(Y\) の相関係数 \(p_{X, Y}\) は、
\[p_{X, Y}= \frac{Cov[X, Y]}{\sqrt{V[X]}\sqrt{V[Y]}}\]
「計量政治学の成績」と「統計入門履修の有無」との相関関係
・「計量政治学の成績」は(離散)確率変数 \(X\) とし、その実現値は次のとおり。
\[x = 1・・・(Grade: F)\] \[x = 2・・・(Grade: C)\] \[x = 3・・・(Grade: B)\] \[x = 4・・・(Grade: A)\]
・「計量政治学の成績」における確率を、確率変数 \(X\) を使うと次のように表せる。
\[P(X=1) = 0.2, P(X=2) = 0.3, P(X=3) = 0.3, P(=4) = 0.2\]
・「統計入門履修の有無」は(離散)確率変数 \(Y\) とし、その実現値は次のとおり。
\[y = 1・・・(履修済)\] \[y = 2・・・(未履修)\]
・「統計入門履修の有無」の確率を、確率変数 \(X\) を使うと次のように表せる。
\[P(X=1) = 0.5, P(X=2) = 0.5\]
・「統計入門履修の有無」と「計量政治学の成績」の同時確率を次のように想定。
\[P(X=1, Y=1) = 0, P(X=2, Y=1) = 0.1, P(X=3, Y=1) = 0.2, P(X=4, Y=1) = 0.2\] \[P(X=1, Y=2) = 0.2, P(X=2, Y=2) = 0.2, P(X=3, Y=2) = 0.1, P(X=4, Y=2) = 0\]
・これらを表にまとめると次の様になる。・この時の \(X, Y\) の期待値は、
\[E[X] = x_1 × p_X(x_1) + ... + x_M × p_X(x_M) = \sum_{i=1}^M x_i × p_X(x_i) \]
\[= [1 × 0 + 1 × 0.2] + [2 × 0.1 + 2 × 0.2] + [3 × 0.2 + 3 × 0.1] + [4 × 0.2 + 4 × 0] = 2.5\]
\[E[Y] = y_1 × p_Y(y_1) + ... + y_M × p_Y(y_M) = \sum_{i=1}^M y_i × p_Y(y_i) \]
\[= [1 × 0 + 1 × 0.1 + 1 × 0.1 + 1 × 0.2] + [2 × 0.2 + 2 × 0.1 + 2 × 0.1 + 2 × 0] = 1.5\]
・この時の \(X, Y\) の共分散 \(Cov[X, Y]\) は、
\[Cov[X, Y] = E[(X-μ_x)(Y-μ_y)]\]
\[=\sum_{i=1}^{M_X}\sum_{j=1}^{M_Y}(x_i-μ_X)(y_j-μ_Y)×p_{X,Y}(x_i, y_i) \] \[=[(1-1.5)×(1-2.5)×0]+[(1-1.5)(2-2.5)×0.2]+[(1-1.5)(2-2.5)×0.2]+[(1-1.5)(3-2.5)×0.2]+ [(1-1.5)×(4-2.5)×0.2] + [(1-1.5)×(4-2.5)×0.2] \] \[+ [(2-1.5)×(1-2.5)×0.2]+[(2-1.5)(2-2.5)×0.2]+[(2-1.5)(3-2.5)×0.1]+[(2-1.5)(4-2.5)×0]=-0.525\]
\(X\) の分散 \(V[X]\) は、 \[V[X] = E[(X-μ)^2] = \sum_{i=1}^M(x_i - μ)^2 × p_X(x_i) \]
\[= (1-1.5)^2 × 0.5 + (2-1.5)^2 × 0.5 = 0.25\]
\(X\) の標準偏差は、\[{\sqrt{V[X]}} = {\sqrt{0.25}} = 0.5\]
\(Y\) の分散 \(V[Y]\) は、 \[V[Y] = E[(Y-μ)^2] = \sum_{i=1}^M(y_i - μ)^2 × p_Y(y_i) \]
\[= [(1-2.5)^2 × 0.2] + [(2-2.5)^2 × 0.3] +[(3-2.5)^2 × 0.3] + [(4-2.5)^2 × 0.2] = 1.65\]
\(Y\) の標準偏差は、\[{\sqrt{V[Y]}} = {\sqrt{1.65}} = 1.28\]
共分散 \(Cov[X, Y]\) は -0.35 だから、相関係数は、
\[p_{X, Y}= \frac{Cov[X, Y]}{\sqrt{V[X]}\sqrt{V[Y]}}\] \[= \frac{-0.525}{\sqrt{0.25}\sqrt{1.65}} = -0.82 \]
・ここでは「統計入門履修の有無」と「計量政治学の成績」との間には負の相関関係があることがわかる。
・同時確率関数を使った条件付確率関数を使う利点
・確率変数 \(Y\) が \(y\) の値をとるという条件の下で => 確率変数 \(X\) が \(x\) の値を取る確率を求めることができる
・確率変数 \(Y\) が \(y\) の値をとるという条件の下で => 確率変数 \(X\) が \(x\) の値を取る期待値を求めることができる
・「ある政策を実施した(しない)という条件下それぞれの「期待値」(=条件付期待値)を測定できる。
・二つの期待値の差を測定すれば、政策の「効果」がわかる。
条件付き確率関数の定義
・離散確率変数 \(X\) は \((x_1,...x_M)\) のいずれかの値をとる。
・離散確率変数 \(Y\) は \((y_1,...y_M)\) のいずれかの値をとる。
・\(Y = y_i\) という条件下での離散確率変数 \(X\) の条件付き確率関数 \(p_X(x|y_i)\) は、
\[p_X(x|y_i)= \frac{p_{X,Y}(x, y_i)}{p_Y(y_i)}\]
条件付き期待値の定義
・離散確率変数 \(X\) は \((x_1,...x_M)\) のいずれかの値をとる。
・離散確率変数 \(Y\) は \((y_1,...y_M)\) のいずれかの値をとる。
・\(Y = y_j\) という条件下での離散確率変数 \(X\) の条件付き期待値 \(E[X|Y=y_j]\) は、
\[E[X|Y=y_j]= x_i × p_X(x_1|y_j) + ... + x_{Mx} × p_X(x_{Mx} | y_j)=\sum_{i=1}^{M_x}x_i× p_X(x_i | y_j) \]
・条件の実現値をまだ決めていないときには、条件付き期待値は次のように表記される。
\[E[X | Y = y]\] \[E[X | y]\] \[E[X | Y]\]
「統計入門履修の有無」と「計量政治学の成績」の条件付き期待値を計算する
・計算のプロセス
(1) 条件付き確率 \(P(X/Y)\) を計算
(2) 条件付き期待値 \(E[X | Y = y_i]\) を計算
条件付き確率 \(P(X/Y)\) の計算
・「統計入門履修の有無」の実現値は次のように想定。
\[y = 1・・・履修済\] \[y = 2・・・未履修\]
・「計量政治学の成績」の実現値は次のように想定。
\[x = 1・・・(Grade: F)\] \[x = 2・・・(Grade: C)\] \[x = 3・・・(Grade: B)\] \[x = 4・・・(Grade: A)\]
・\(A\) が起きたという条件のもとで \(B\) が起きる条件付き確率 \(P(B | A)\) は次の式で表せる。
\[P(B | A) = \frac{P(A∩B)}{P(A)}\]
・「統計入門履修の有無」の確率(\(=P(A)\))は、
\[P(Y=1) = 0.5, P(Y=2) = 0.5\]
・「統計入門履修の有無」と「計量政治学の成績」の同時確率(\({=P(A∩B)}\))は次のように想定。
\[P(X=1, Y=1) = 0, P(X=2, Y=1) = 0.1, P(X=3, Y=1) = 0.2, P(X=4, Y=1) = 0.2\] \[P(X=1, Y=2) = 0.2, P(X=2, Y=2) = 0.2, P(X=3, Y=2) = 0.1, P(X=4, Y=2) = 0\]
【統計入門・・・履修済 \(Y=1\)】
・「統計入門を履修したという条件下(\(Y=1\))での、計量政治学の成績が \(F(X = 1)\)の確率
\[P(X=1 | Y=1) = \frac{P(X=1, Y=1)}{P(Y=1)}=\frac{0}{0.5}=0\]
・「統計入門を履修したという条件下(\(Y=1\))での、計量政治学の成績が \(C(X = 2)\)の確率
\[P(X=2 | Y=1) = \frac{P(X=2, Y=1)}{P(Y=1)}=\frac{0.1}{0.5}=0.5\]
・「統計入門を履修したという条件下(\(Y=1\))での、計量政治学の成績が \(B(X = 3)\)の確率
\[P(X=3 | Y=1) = \frac{P(X=3, Y=1)}{P(Y=1)}=\frac{0.2}{0.5}=0.4\]
・「統計入門を履修したという条件下(\(Y=1\))での、計量政治学の成績が \(A(X = 4)\)の確率
\[P(X=4 | Y=1) = \frac{P(X=4, Y=1)}{P(Y=1)}=\frac{0.2}{0.5}=0.4\]
【統計入門・・・未履修 \(Y=2\)】
・「統計入門を未履修という条件下(\(Y=2\))での、計量政治学の成績が \(F(X = 1)\)の確率
\[P(X=1 | Y=2) = \frac{P(X=1, Y=2)}{P(Y=2)}=\frac{0.2}{0.5}=0.4\]
・「統計入門を未履修という条件下(\(Y=2\))での、計量政治学の成績が \(C(X = 2)\)の確率
\[P(X=2 | Y=2) = \frac{P(X=2, Y=2)}{P(Y=2)}=\frac{0.2}{0.5}=0.4\]
・「統計入門を未履修という条件下(\(Y=2\))での、計量政治学の成績が \(B(X = 3)\)の確率
\[P(X=3 | Y=2) = \frac{P(X=3, Y=2)}{P(Y=2)}=\frac{0.1}{0.5}=0.2\]
・「統計入門を未履修という条件下(\(Y=2\))での、計量政治学の成績が \(A(X = 4)\)の確率
\[P(X=4 | Y=2) = \frac{P(X=4, Y=2)}{P(Y=2)}=\frac{0}{0.5}=0\]
条件付き期待値 \(E[X | Y = y_i]\) の計算
・\(Y = y_j\) という条件下での離散確率変数 \(X\) の条件付き期待値 \(E[X|Y=y_j]\) は、
\[E[X|Y=y_j]= x_i × p_X(x_1|y_j) + ... + y_{M_y} × p_X(x_{Mx} | y_j) =\sum_{j=1}^{M_x}x_i × p_X(x_i | y_j)\]
・「統計入門を履修という条件下 \(Y = 1\) での、計量政治学の成績の期待値: \(E[X | Y=1]\) は、 \[E[X|Y=y_1]= [1 × 0] + [2 × 0.1] + [3 × 0.2] + [4 × 0.2] = 1.6\]
・「統計入門を未履修という条件下 \(Y = 2\) での、計量政治学の成績の期待値: \(E[X | Y=2]\) は、 \[E[X|Y=y_2]= [1 × 0.2] + [2 × 0.2] + [3 × 0.1] + [4 × 0] = 0.9\]
結論・・・「統計入門」を履修した学生の方が、未履修の学生よりも平均的に高い GPA が期待される。
・\(a\) を定数、\(X\) と \(Y\) を確率変数とする。
\((1) E[a] = a\)
\((2) E[X+Y] = E[X] + E[Y]\)
\((3) X と Y が独立なら、E[XY] = E[X]E[Y]\)
\((4) E[aX] = aE[X]\)
・\(a\) を定数、\(X\) と \(Y\) を確率変数とする。
\((1) E[a | X] = a\)
\((2) E[X | X] = X\)
\((3) E[aX | X] = aX\)
\((4) E[X + Y | Z] = E[X | Z] + E[Y | Z]\)
\((5) E[X + Y | Z] = E[X | Z] + E[Y | Z]\)
\((6) E[E[X | Y]] = E[X]\)
・離散確率変数 \(X\) は \((x_1,...x_M)\) のいずれかの値をとる。
・離散確率変数 \(Y\) は \((y_1,...y_M)\) のいずれかの値をとる。
・\(Y = y_j\) という条件下での離散確率変数 \(X\) の条件付き分散 \(E[X|Y=y_i]\) は、
\[V[X|Y=y_j]= (x_i-μ_X(y_j))^2 × p_X(x_1|y_j) + ... + (x_{Mx}-μ_X(y_i))^2 × p_x(x_{Mx} | y_j)=\sum_{i=1}^{M_x}(x_i-μ_X(y_j))^2 × p_X(x_i | y_j) \]
となる。
ただし、\(μ_X(y_j)\) は \(Y = y_j\) の時の \(X\) の条件付き期待値
\[μ_X(y_j) = E[X | Y = y_j]\]
である。
・条件の実現値をまだ決めていないときには、条件付き期待値は次のように表記される。
\[V[X | Y = y]\] \[V[X | y]\] \[V[X | Y]\]
・連続変数について確率を考えるときには
・確率変数の範囲を使う。
・確率変数 \(X\) が 0 から 10 いずれかの値を連続的にとるとする。
・確率変数 \(X\) が円周率 \(π = 3.14\) をとる確率はゼロ。
・しかし、確率変数 \(X\) が円周率 \(π\) の ±1 の範囲を取る確率はゼロではない。
==> 累積分布関数と関連
・確率密度関数(=確率変数 \(X\) が \(x\) となる確率密度を表す関数)は \(f(x)\) と表す。
・累積分布関数(=確率変数 \(X\) が \(x\) 以下となる確率を表す関数)は \(F(x)\) と表す。
・連続確率変数の場合、確率密度関数と \(x\) 軸で挟まれた部分の面積が必ず 1 になる。
累積分布関数の定義
・確率変数 \(X\) に対して累積分布関数は、
\[F_X(x) = P(X≦x)\]
である。特に確率変数 \(X\) が \(a\) より大きく \(b\) 以下の区間に入る確率は、
\[P(a < X ≦ b) = F_X(b) - F_X(a)\]
となる。
・累積分布関数 \(F(x)\) を使うと、確率変数 \(X\) の実現値がある値 \(x\) 以下になる確率がわかる。
・\(x\) が増えると、累積分布関数の値も増える。
・\(x\) が「ほんの少しだけ」増えたとき、累積分布関数の値が「大きく」増えた
==> もとの \(x\) から新たに増えた \(x\) までの範囲の値が実現しやすい
・\(x\) が増えたときの累積分布関数の値の増え方(増加率) = 確率密度関数: \(f(x)\)
確率密度関数の定義
・\(x\) の微少な増加分を \(Δx (>0)\) とする
・\(a=x, b =x + Δx\) とする
・確率変数 \(X\) の実現値が \(a\) より大きく \(b\) 以下の範囲に入る確率は、
\[F_X(x+Δx) - F_X(x)\]
・この累積分布関数の増加分を \(x\) の増加分 \(Δx\) で割れば、累積分布関数の増加率が得られる。
\[f_X(x)= \frac{F_X(x+Δx)-F_X(x)}{Δx}\]
・この \(x\) の増加分 \(Δx\) を限りなく 0 に近づけたものが確率密度関数: \(f(x)\)
・確率密度関数 \(f(x)\) は累積分布関数 \(F(x)\) を微分したもの。
・確率変数が連続の場合でも、確率密度関数や累積分布関数を使うと、離散確率変数の場合と同じように期待値、分散、条件付き確率、条件付き期待値を計算できる。