[Stata]カテゴリー変数の作成

abstract painting stata
Photo by Tom Swinnen on Pexels.com

カテゴリー変数の作成方法

例えば連続変量でありageを10歳ごとにカテゴリー変数にする時には、

egen agecat = cut(age), at(10, 20, 30, 40, 50, 60, 70, 80, 90, 100)

とすれば良い。n分位で区切る時は、

xtile agecat = age, nquantiles(n)

とする。また、20歳より下をまとめて、70歳より上もまとめる時は、

egen agecat = cut(age), at(0, 20, 30, 40, 50, 60, 70, 110)

などとすれば良い。この場合、カテゴリー1には0歳から19歳まで、カテゴリー2には20歳から29歳までが含まれている。カテゴリー1を0歳から20歳までとしたいときには、上記を

egen agecat = cut(age), at(0, 21, ...)

とすれば良い。

ラベルについて

以下のリンク先にもあるが、このままcutオプションを使うとラベルが30とか40とかatの中の数字になってしまう。それを回避するには、icodesオプションを使う。

egen agecat = cut(age), at(0, 10, 20, ...) icodes

こうすればラベルが\(0, 1, \cdots\)となる。

関連リンク

How can I recode continuous variables into groups? | Stata FAQ

データクリーニング
複数の置き換え

コメント

タイトルとURLをコピーしました