Stataで変数を確認する方法
https://www.stata.com/manuals/rtabulateoneway.pdf
https://www.stata.com/manuals/rtabulatetwoway.pdf#rtabulatetwoway
基本は上のリンクにある。また、以下の説明でコマンド中に下線が引かれているものは、その部分だけ入力すれば省略できるということである。
コマンドの基本
まずは
tablulate var
(varは変数名)で頻度を表示できる。頻度順に表示したいときは、
tab var, sort
とsortオプションを入力する。欠損値を含めて表示するときは
tab var, missing
とする。mオプションは必ずつけた方が良い。特に新しい変数を自分で定義したときなどは、おかしなことが起こっていないかの確認になる。
たくさんの変数を一気に見たいときは、
tab1 var1 var2 var3, ...
とすれば良い。群別に見たいときは、
tab var1 if var2 == 1
などとif文を用いる。
簡単なプロットも表示
これは初めて知った。
tabulate var1, plot
簡単なバーチャートが表示される。

二変数のテーブルtwoway tabulate
二変数の関係をみるのに用いられる。基本は
tabulate var1 var2
である。行ごと(横)のパーセンテージを表示するのは
tab var1 var2, row
であり、列ごと(縦)のパーセンテージを表示するのは
tab var1 var2, column
となる。重要なのは、二変数同士のカイ二乗検定であるが、これは
tab var1 var2, chi2 cchi2
となる。cchi2オプションでそれぞれのセルの寄与度を表示できる。

Fisherの正確確率検定を行うには、
ta var1 var2, exact
オプションを用いる。カイ二乗検定以外の比較を行うときは、allオプションで行う。
ta var1 var2, all

3つ以上の変数のtabulation
tab1オプションではなくtab2オプションを用いる。
tab2 var1 var2 var3
この場合、var1とvar2、var1とvar3、およびvar2とvar3のtabが表示される。また、層別して表示するときは、tabulateではなくtableコマンドを用いる。
table (var1 var2) var3


コメント