library(broom)     # For converting models into tables
library(DT)
library(haven)
library(huxtable)  # For side-by-side regression table
library(rdrobust)  # For robust nonparametric RDD  
library(rddensity) # For nonparametric RDD
library(stargazer)
library(tidyverse) # For ggplot
  • 作図用代用フォントの設定
theme_set(theme_gray(base_size = 10, base_family = "HiraginoSans-W3"))  # macOS用
theme_set(theme_gray(base_size = 10, base_family = "Meiryo"))        # Windows用

I. RDD を使ってわかること

1. RDD の定義

  • 不連続回帰デザイン (RDD:regression discontinuity design) は1960年に Thistlewaite and Campbell によって提唱された研究手法

  • 研究手法としては古くから存在しているが、実際に研究デザインとして使われ始めたのは 1999年以降

  • Angrist and Lavy (1999)・・・小学校のクラスの大きさが成績に与える影響

  • Lee (2008)・・・米国議会選挙における現職政治家であることの影響

  • 有益な Rパッケージ:
    rdrobust・・・バンド幅の選択や処置効果の推定に関して最も進歩した Rパッケージ
    rddensity・・・頑強なノンパラメトリックRD推定向けのRパッケージ

  • RDD (regression discontinuity design) とはデータの発生メカニズムに注目した準実験法  

  • 無作為割り付け (RCT) を使った分析であれば実験法と呼ばれるが、RCT を使えない時に使う分析方法なので準実験法 (pseudo experiment) と呼ばれる

  • 局所的な範囲で RCT が成立しているとみなすことができるため「最も実験研究に近いデザイン」といわれる

  • RDD は次の 4 通りで呼ばれる

・回帰不連続デザイン
不連続回帰デザイン
非連続回帰デザイン
・RD デザイン

  • 自然法則ではない強制的なルールによって生まれる境界線を利用した分析
境界線の例:

・試験で 60 点未満なら補講に参加する
・法定飲酒年齢: 21歳(米国の場合)
・高齢者の医療費の自己負担割合: 70歳
・小学校での1クラスあたりの人数の上限: 30人
・選挙区定数: 1 人

2. 何がわかるのか?

  • ここでは、RDD を使う事でどのようなことが明らかになるのかいくつか例を挙げてみよう

2.1 補講が生徒の試験点数に与える処置効果

  • 前期試験で 60 点未満とった生徒が補講授業を受けた時の、補講が後期試験結果に与える処置効果を推定できる
前期試験で 60 点未満だった人: 補講を受けた・・・treatment group(処置群)
前期試験で 60 点以上だった人: 補講を受けない・・・control group(統制群)
  • 「補講に参加したかどうか」という要因以外に、「後期試験結果」に影響を与える違いはないという前提が必要
  • 前期試験で 60点の境界線の前後で「後期試験結果」に違いがあれば・・・
    → その「後期試験結果」は「補講」によるものと見なせるはず
  • 下の図に描かれている縦の赤い矢印が推定された処置効果の大きさであり「補講の効果あり」という結果が得られる