今日は他の人の研究のアンケート結果の解析を手伝ったのですがなかなか勉強になりました。
社会科学のアンケート調査ではよくクロス集計を行ってχ二乗検定などをするわけですが、項目間の関連性を見たい場合にはクラメールV連関係数を使って調べます。
今回たくさん組み合わせがあったので@ytakedaさんのQiitaの投稿を大に参考して、すべてのクロス集計の組み合わせについて計算を行い、使えそうなものだけ抽出するプログラムをRで書きました。Rのassocstatsを利用してクラメール連関係数やp値を取り出します。
Githubに公開したのでコードは省略します。
R/cramervCalc.R at master · fukkie711/R
参考文献:
RDocumentation:assocstats
assocstats function | R Documentation
こちらを大いに参考させていただいた
R 大量のカテゴリ変数から変数間の連関度を表すクラメールV指標を計算し、有意で連関があるペアのみ抽出する – Qiita
p値が指数表示になるのを解除
Rの指数表示はどこまで回避できるのか【結果的に意味がなかったエントリ】 – The Midnight Seminar
クラメール連関係数の計算ロジック。てか、計算式知らずに分析してる人絶対多いですよね
カイ2乗検定・クラメール連関係数(2/2) :: 株式会社アイスタット|統計分析研究所
クラメール連関係数の値の根拠
ch11a.pdf
統計データの種類には、質的データ(名義尺度、順序尺度)と量的データ(間隔尺度、比例尺度)がある。代表的な統計手法を使う場合には主に量的データを使うことが多く、アンケート設計には注意が必要である。
1-4. 変数の尺度 | 統計学の時間 | 統計WEB