1. 非連続回帰デザイン: RDD
-1.1. RDD とは
-1.2. 補講授業モデル
-1.3. トリートメント効果の識別
-1.4. トリートメント効果の計算(二つの回帰式)
-1.5. トリートメント効果の計算(一つの回帰式)

2. データの作成
-2.1. 2012年衆院選における「勝敗率」
-2.2. 2014年衆院選における「勝敗率」
-2.3. データのマージ

3. 衆議院選挙データを使った RDD 分析
-3.1. トリートメント効果の識別
-3.2. トリートメント効果の計算(二つの回帰式)
-3.3. トリートメント効果の計算(一つの回帰式)

1. 非連続回帰デザイン: RDD

1.1. RDD とは

非連続回帰デザイン (RDD: Regression Discontinuity Design)
・Thistlethwaite と Campbell が Journal of Educational Psychology (1960) で初めて発表した研究デザイン。
・データの発生メカニズムに注目した準実験法。
・非連続回帰デザインが適用できるデータは限定的。
・しかし、比較的弱い仮定のもとで、トリートメントの因果的効果を推定できる。
・ある連続変数の値 (Z) が特定のカットオフ値よりも高いか低いかによって、トリートメント群 (T = 1) になるかコントロール群 (T = 0) になるかを決めて、介入効果を推定する方法。
・カットオフ値の前後の人々・・・偶然それぞれの群に割り振られた可能性が高い。
・唯一異なるのはどちらの群に属するかということだけ。
・この二つの群の間でアウトカムを比較 → 介入効果 (T) を抽出できる。

1.2. 補講授業モデル

・大学の授業は前期と後期がある。
・いずれの試験も100点満点
  前期の試験で c 点未満 → 補講授業に参加
  前期の試験で c 点以上 → 補講授業に不参加
・ある学生 \(\mathrm{i (i = 1, ..., n)}\) について、
  補講に参加している場合 \(\mathrm{T_i = 1}\)
  不参加のばあい \(\mathrm{T_i = 0}\)
・後期試験点数 \(\mathrm{Y_i}\) で表す。
 学生 \(\mathrm{i}\) が補講に参加して得た後期試験の点数・・・ \(\mathrm{Y_i(1)}\)
 学生 \(\mathrm{i}\) が補講に参加せずに得た後期試験の点数・・・ \(\mathrm{Y_i(0)}\)
・学生 \(\mathrm{i}\) 前期試験の点数・・・ \(\mathrm{Z_i}\) (強制変数)

・ここでのトリートメントの割り当ては次のようになる

・補講への参加を決める前期試験の点数 (c) は既知
\(\mathrm{Z_i}\) がわかれば、学生 \(\mathrm{i}\) が Treatment Group か Control Group、どちらに属するかわかる。
・Treatment か Control かを決める変数 = 強制変数 (forcing variable)
・強制変数は必ず連続変数
\(\mathrm{Z_i = c}\) という学生\(\mathrm{i}\) は存在しない。
→全ての学生は必ず Treatment もしくは Control Group に分類される。
・200人の学生について、次のデータが得られた。

\(\mathrm{(Y_i, Z_i): i = 1, ... , 200}\)

・このセクションの分析で使うデータ exam.score.csv をダウンロードし、RProject Folder に保存する。

library(readr)

・データを読み取り、exam と名前を付ける。

exam <- read.csv("exam.score.csv")

# データの初めと終わりを表示する。  
head(round(exam, digits = 0))
   Y  Z T
1 43 27 1
2 67 31 1
3 54 31 1
4 51 32 1
5 73 36 1
6 46 37 1
tail(round(exam, digits = 0))
      Y  Z T
195  74 87 0
196  81 88 0
197  85 89 0
198  92 90 0
199 100 90 0
200  86 92 0

・前期試験点数を x 軸、後期私見点数を y 軸にして散布図を描く。

plot(exam$Z, exam$Y,  
     xlab = "Zi: Test Score (Spring)",
     ylab = "Yi: Test Score (Fall)",
     main = "Two Test Scores: Spring and Fall")
abline(v=60, lty = 2)  # Zi = 60 に縦の点線を引く
text(42, 100, "Treatment Group (T = 1)") 
text(75, 100, "Control Group (T = 0)")

・前期試験の点数60点より左が Treatment Group (T = 1)。
・前期試験の点数60点より右が Control Group (T = 0)。
・前期試験の点数が高いほど、後期試験の点数が高い。

1.3. トリートメント 効果の識別

・ここで知りたいことは「補講授業に参加したことが学力に与える因果的効果」
・ある学生 \(\mathrm{i}\) についてこの効果は\(\mathrm{Y_i(1) - Y_i(0)}\) と表せる。
・しかし、観測できるのは \(\mathrm{Y_i(1) もしくは Y_i(0)}\) のいずれか一方だけ。
・ある学生 \(\mathrm{i}\) に対する因果的効果ではなく、一定のグループにおける平均的な因果的効果を推定する。
・補講授業に参加すること(\(\mathrm{T_i}\))が、潜在的な点数 (\(\mathrm{Yi(1), Y_i(0)}\) ) と完全に独立なら

→ [Treatment G の Y の平均値] − [Control