[Stata]重複のカウント

duplicatesを用いる。

https://www.stata.com/manuals/dduplicates.pdf

duplicates report

とするだけで重複を報告してくれる。

copiesが1となるものが単独ものもで、2以上になると重複しているものになる。その他

duplicates report var
duplicates report var1 var2

と変数ごとに重複を報告させることもできる。フラグを立てる時は、

duplicates tag var, gen(newvar)

とすると、重複回数を新たにnewvarという変数に代入してくれる。例えば\(3\)個の重複がある時は、newvar = \(2\)になるので、新たに\(+1\)などとして重複回数を数えるといい。削除する時は、

duplicates drop var, force

を用いる。forceオプションは必須。

コメント

タイトルとURLをコピーしました