duplicatesを用いる。
https://www.stata.com/manuals/dduplicates.pdf
duplicates report
とするだけで重複を報告してくれる。
copiesが1となるものが単独ものもで、2以上になると重複しているものになる。その他
duplicates report var
duplicates report var1 var2
と変数ごとに重複を報告させることもできる。フラグを立てる時は、
duplicates tag var, gen(newvar)
とすると、重複回数を新たにnewvarという変数に代入してくれる。例えば\(3\)個の重複がある時は、newvar = \(2\)になるので、新たに\(+1\)などとして重複回数を数えるといい。削除する時は、
duplicates drop var, force
を用いる。forceオプションは必須。
コメント