1. カテゴリカル変数間の関連
- 1.1 クロス表
- 1.2 カイ二乗値の求め方
- 1.3 カイ二乗検定
- 1.4 統計的有意性とサンプル数
- 1.5 フィシャーの直接確率計算法
2. 数量変数間の関連
- 2.1 相関関係の種類・散布図・相関係数
- 2.2 相関係数を使った統計的仮説検定
- 2.3 qgraphパッケージを使った相関係数の可視化

Assignment1
Assignment2
Assignment3
Assignment4

References

1. カテゴリカル変数間の関連

1.1 クロス表

2 つの質的変数の関連性を示す集計方法。 データ情報を失うことなく 2 変数間の関係を分析できる。 例)男女間で内閣支持率に差があるか? 「性別」と「内閣支持率」(仮想データ)

chi2_data1.csv をダウンロードし、RProjectフォルダーに保存する。
* データのダウンロードが終わったら、データを読み込み cabinet1 と名前を付ける。

library(readr)
cabinet1 <- read_csv("chi2_data1.csv", na = ".") 
# データフレーム cabinet1 に含まれている変数を表示する。
names(cabinet1)
[1] "serial"  "male"    "support"
# データフレーム cabinet1 の最初の6行を表示する。
head(cabinet1)
# A tibble: 6 x 3
  serial  male support
   <int> <int>   <int>
1      1     1       1
2      2     1       1
3      3     1       1
4      4     1       1
5      5     1       1
6      6     1       1
# データフレーム cabinet1 の最後の6行を表示する。
tail(cabinet1)
# A tibble: 6 x 3
  serial  male support
   <int> <int>   <int>
1    995     0       0
2    996     0       0
3    997     0       0
4    998     0       0
5    999     0       0
6   1000     0       0

【3種類のクロス表】
①行 (row) に注目したクロス表
②列 (column) に注目したクロス表
③全体に注目したクロス表
R 上で male と support のクロス表を作成するためには次のコマンドを使う。

table_cabinet1 <- with(cabinet1, table(male, support))  
table_cabinet1
    support
male   0   1
   0 250 250
   1 200 300

通常は周辺度数を加えて、次の様に表示する。

table_cabinet1 <- with(cabinet1, table(male, support))  
addmargins(table_cabinet1)  
     support
male     0    1  Sum
  0    250  250  500
  1    200  300  500
  Sum  450  550 1000

R 上で行 (row) パーセントに注目したクロス表を表示させる。

## まず列周辺度数を加える; margin=1 で列周辺度数のみ加える
row_cabinet1 <- addmargins(table_cabinet1, margin = 1) 

## 度数を比率に変換する; margin=1 で行パーセント
row_cabinet1 <- prop.table(row_cabinet1, margin = 1)

## パーセント表示に変換する; 小数第2位までの表示にする
row_cabinet1<- round(100 * row_cabinet1, 2)

## 行周辺度数を加えて表示する; margin=2 で行周辺度数のみ加える
addmargins(row_cabinet1, margin = 2)
     support
male    0   1 Sum
  0    50  50 100
  1    40  60 100
  Sum  45  55 100
 

列 (column) に注目したクロス表