[Stata]変数の確認方法(one/twoway-tabulate)

Stataで変数を確認する方法

https://www.stata.com/manuals/rtabulateoneway.pdf
https://www.stata.com/manuals/rtabulatetwoway.pdf#rtabulatetwoway

基本は上のリンクにある。また、以下の説明でコマンド中に下線が引かれているものは、その部分だけ入力すれば省略できるということである。

コマンドの基本

まずは

tablulate var

(varは変数名)で頻度を表示できる。頻度順に表示したいときは、

tab var, sort

とsortオプションを入力する。欠損値を含めて表示するときは

tab var, missing

とする。mオプションは必ずつけた方が良い。特に新しい変数を自分で定義したときなどは、おかしなことが起こっていないかの確認になる。

たくさんの変数を一気に見たいときは、

tab1 var1 var2 var3, ...

とすれば良い。群別に見たいときは、

tab var1 if var2 == 1

などとif文を用いる。

簡単なプロットも表示

これは初めて知った。

tabulate var1, plot

簡単なバーチャートが表示される。

plotオプション

二変数のテーブルtwoway tabulate

二変数の関係をみるのに用いられる。基本は

tabulate var1 var2

である。行ごと(横)のパーセンテージを表示するのは

tab var1 var2, row

であり、列ごと(縦)のパーセンテージを表示するのは

tab var1 var2, column

となる。重要なのは、二変数同士のカイ二乗検定であるが、これは

tab var1 var2, chi2 cchi2

となる。cchi2オプションでそれぞれのセルの寄与度を表示できる。

カイ二乗検定。

Fisherの正確確率検定を行うには、

ta var1 var2, exact

オプションを用いる。カイ二乗検定以外の比較を行うときは、allオプションで行う。

ta var1 var2, all
allオプション。

3つ以上の変数のtabulation

tab1オプションではなくtab2オプションを用いる。

tab2 var1 var2 var3

この場合、var1とvar2、var1とvar3、およびvar2とvar3のtabが表示される。また、層別して表示するときは、tabulateではなくtableコマンドを用いる。

table (var1 var2) var3
N-way

関連記事

tabstatの使い方、カテゴリーごとの要約量について

コメント

タイトルとURLをコピーしました