- このセクションで使っている R packages

library(jtools)
library(tidyverse)
library(patchwork)
library(stargazer)

なぜバイアスが問題なのか?

  • バイアスが存在すると、OLS などのパラメータ推定値が真の値からずれてしまう
  • ここでは、重回帰分析における変数選択に関連して、次の二つのバイアスを考える
バイアスの種類 問題点
(1) 不必要な変数を含めた時のバイアス 無益だが有害ではない
(2) 必要な説明変数を含めない時のバイアス 推定値にバイアスが生じる → より深刻

必要な説明変数を含めない時のバイアス
=「脱落(欠落)変数バイアス」 (OVB: Omitted variable bias)

  • 実際に日本の衆院選挙データ (1996-2017) を使って OVB を確認してみる

1. 不必要な変数を含めた時のバイアス

  • ここでは投票率を説明するモデルを考えてみる
  • 左が「正しいモデル」で右が「間違ったモデル」だとしよう