カテゴリー変数の作成方法
例えば連続変量でありageを10歳ごとにカテゴリー変数にする時には、
egen agecat = cut(age), at(10, 20, 30, 40, 50, 60, 70, 80, 90, 100)
とすれば良い。n分位で区切る時は、
xtile agecat = age, nquantiles(n)
とする。また、20歳より下をまとめて、70歳より上もまとめる時は、
egen agecat = cut(age), at(0, 20, 30, 40, 50, 60, 70, 110)
などとすれば良い。この場合、カテゴリー1には0歳から19歳まで、カテゴリー2には20歳から29歳までが含まれている。カテゴリー1を0歳から20歳までとしたいときには、上記を
egen agecat = cut(age), at(0, 21, ...)
とすれば良い。
ラベルについて
以下のリンク先にもあるが、このままcutオプションを使うとラベルが30とか40とかatの中の数字になってしまう。それを回避するには、icodesオプションを使う。
egen agecat = cut(age), at(0, 10, 20, ...) icodes
こうすればラベルが\(0, 1, \cdots\)となる。
関連リンク
How can I recode continuous variables into groups? | Stata FAQ
コメント