1. カテゴリカル変数間の関連
- 1.1 クロス表
- 1.2 カイ二乗値の求め方
- 1.3 カイ二乗検定
- 1.4 統計的有意性とサンプル数
- 1.5 フィシャーの直接確率計算法
2. 数量変数間の関連
- 2.1 相関関係の種類・散布図・相関係数
- 2.2 相関係数を使った統計的仮説検定
- 2.3 qgraphパッケージを使った相関係数の可視化
・Assignment1
・Assignment2
・Assignment3
・Assignment4
2 つの質的変数の関連性を示す集計方法。 データ情報を失うことなく 2 変数間の関係を分析できる。 例)男女間で内閣支持率に差があるか? 「性別」と「内閣支持率」(仮想データ)
chi2_data1.csv をダウンロードし、RProjectフォルダーに保存する。
* データのダウンロードが終わったら、データを読み込み cabinet1 と名前を付ける。
library(readr)
cabinet1 <- read_csv("chi2_data1.csv", na = ".")
# データフレーム cabinet1 に含まれている変数を表示する。
names(cabinet1)
[1] "serial" "male" "support"
# データフレーム cabinet1 の最初の6行を表示する。
head(cabinet1)
# A tibble: 6 x 3
serial male support
<int> <int> <int>
1 1 1 1
2 2 1 1
3 3 1 1
4 4 1 1
5 5 1 1
6 6 1 1
# データフレーム cabinet1 の最後の6行を表示する。
tail(cabinet1)
# A tibble: 6 x 3
serial male support
<int> <int> <int>
1 995 0 0
2 996 0 0
3 997 0 0
4 998 0 0
5 999 0 0
6 1000 0 0
【3種類のクロス表】
①行 (row) に注目したクロス表
②列 (column) に注目したクロス表
③全体に注目したクロス表
R 上で male と support のクロス表を作成するためには次のコマンドを使う。
table_cabinet1 <- with(cabinet1, table(male, support))
table_cabinet1
support
male 0 1
0 250 250
1 200 300
通常は周辺度数を加えて、次の様に表示する。
table_cabinet1 <- with(cabinet1, table(male, support))
addmargins(table_cabinet1)
support
male 0 1 Sum
0 250 250 500
1 200 300 500
Sum 450 550 1000
R 上で行 (row) パーセントに注目したクロス表を表示させる。
## まず列周辺度数を加える; margin=1 で列周辺度数のみ加える
row_cabinet1 <- addmargins(table_cabinet1, margin = 1)
## 度数を比率に変換する; margin=1 で行パーセント
row_cabinet1 <- prop.table(row_cabinet1, margin = 1)
## パーセント表示に変換する; 小数第2位までの表示にする
row_cabinet1<- round(100 * row_cabinet1, 2)
## 行周辺度数を加えて表示する; margin=2 で行周辺度数のみ加える
addmargins(row_cabinet1, margin = 2)
support
male 0 1 Sum
0 50 50 100
1 40 60 100
Sum 45 55 100