• このセクションで使う R パッケージ一覧
library("corrr")
library("psych")
library("qgraph")
library("tidyverse")

1. カテゴリカル変数間の関連

1.1 クロス表

2 つの質的変数の関連性を示す集計方法  データ情報を失うことなく 2 変数間の関係を分析できる  例)男女間で内閣支持率に差があるか? 「性別」と「内閣支持率」(仮想データ)

chi2_data1.csv をダウンロードし、RProject フォルダー内の data フォルダに保存する 
* データのダウンロードが終わったら、データを読み込み cabinet1 と名前を付ける 

cabinet1 <- read_csv("data/chi2_data1.csv") 
  • データフレーム cabinet1 に含まれている変数を表示する
names(cabinet1)
[1] "serial"  "male"    "support"
  • データフレーム cabinet1 の最初の6行を表示する 
head(cabinet1)
# A tibble: 6 x 3
  serial  male support
   <dbl> <dbl>   <dbl>
1      1     1       1
2      2     1       1
3      3     1       1
4      4     1       1
5      5     1       1
6      6     1       1
  • データフレーム cabinet1 の最後の6行を表示する 
tail(cabinet1)
# A tibble: 6 x 3
  serial  male support
   <dbl> <dbl>   <dbl>
1    995     0       0
2    996     0       0
3    997     0       0
4    998     0       0
5    999     0       0
6   1000     0       0

【3種類のクロス表】
①行 (row) に注目したクロス表
②列 (column) に注目したクロス表
③全体に注目したクロス表
- R 上で malesupport のクロス表を作成するためには次のコマンドを使う 

table_cabinet1 <- with(cabinet1, table(male, support))  
table_cabinet1
    support
male   0   1
   0 250 250
   1 200 300
  • 通常は周辺度数を加えて、次の様に表示する 
table_cabinet1 <- with(cabinet1, table(male, support))  
addmargins(table_cabinet1)  
     support
male     0    1  Sum
  0    250  250  500
  1    200  300  500
  Sum  450  550 1000