感度・特異度
検査の感度・特異度を語る上で欠かせないのは分割表を記載することに尽きる。
病気あり | 病気なし | |
検査陽性 | \(a\) | \(b\) |
検査陰性 | \(c\) | \(d\) |
このように記載し、合計人数も書き込む。
病気あり | 病気なし | ||
検査陽性 | \(a\) | \(b\) | \(a+b\) |
検査陰性 | \(c\) | \(d\) | \(c+d\) |
\(a+c\) | \(b+d\) | \(a+b+c+d\) |
これが書ければ問題はほとんど解けたも同然と言っていい。
検査の感度・特異度はあくまで検査についての話だと認識すればいい。つまり、「病気の人を正しく病気だと捉えることができる割合」を感度と言い、「病気でない人を正しく病気でないと捉えることができる割合」を特異度という。上の表で言うと、感度は\(\displaystyle \frac{a}{a+c}\)であり、特異度は\(\displaystyle \frac{d}{c+d}\)になる。
陽性適中率・陰性適中率
陽性適中率と陰性適中率は病気についての話なので、横に表を見る。陽性適中率は「検査で陽性の人のうち、本当に病気である人の割合」で、陰性適中率は「検査で陰性の人のうち、本当に病気でない人の割合」となる。上の表だと陽性適中率は\(\displaystyle \frac{a}{a+b}\)で、陰性適中率は\(\displaystyle \frac{d}{c+d}\)となる。
感度・特異度、あるいは陽性適中率・陰性適中率は言葉や式で覚えようとすると混乱するので、丁寧に分割表を描くことが大切。
問題演習を通じて理解を高める。
以下は2008年の臨床検査技師国家試験問題である。
スクリーニング検査で対象者集団の有病率の影響を受けるのはどれか。
1. 精度
2. 感度
3. 特異度
4. ROC曲線
5. 陽性反応的(適)中率
これも分割表を作り、適当に数値を入れてみるとよい。まずは有病率を10%(100人中10人が病気)にしてみる。
病気あり | 病気なし | ||
検査陽性 | |||
検査陰性 | |||
\(10\) | \(90\) | \(100\) |
次に、検査の感度と特異度を適当に0.9, 0.8などとしておく。
病気あり | 病気なし | ||
検査陽性 | \(10\times 0.9 = 9\) | ||
検査陰性 | \(90\times 0.8 = 72\) | ||
\(10\) | \(90\) | \(100\) |
これで表が完成する。
病気あり | 病気なし | ||
検査陽性 | \(9\) | \(90-72 = 18\) | \(9+18 = 27\) |
検査陰性 | \(10-9=1\) | \(72\) | \(1+72 = 73\) |
\(10\) | \(90\) | \(100\) |
感度、特異度、陽性適中率、陰性適中率は順に\(\displaystyle 0.9, 0.8, \frac{9}{27} = 0.333\cdots, \frac{72}{73} = 0.986\cdots\)となる。さて、同じ感度・特異度で今度は有病率を20%(100人のうち20人が病気)にしてみる。
病気あり | 病気なし | ||
検査陽性 | |||
検査陰性 | |||
\(20\) | \(80\) | \(100\) |
この段階で「有病率が変わっても感度・特異度が変わるはずがない」と気がつくが、続ける。
病気あり | 病気なし | ||
検査陽性 | \(20\times 0.9 = 18\) | ||
検査陰性 | \(80\times 0.8 = 64\) | ||
\(20\) | \(80\) | \(100\) |
病気あり | 病気なし | ||
検査陽性 | \(18\) | \(80-64 = 16\) | \(18+16=34\) |
検査陰性 | \(20-18 = 2\) | \(64\) | \(2+64 = 66\) |
\(20\) | \(80\) | \(100\) |
感度、特異度、陽性適中率、陰性適中率は順に\(\displaystyle 0.9, 0.8, \frac{18}{34} = 0.529\cdots, \frac{64}{66} = 0.9696\cdots\)となる。
これらから、有病率の影響を受けるのは「陽性適中率」であることがわかる。
一般に、対象集団の有病率が上がると、陽性適中率は上がり、陰性適中率は下がる。ただし、これをおまじないみたいに覚えようとすると必ず間違えるし混乱するので、試験場などでも慌てず分割表を記載することを強くおすすめする。
もう一問簡単な問題を解いてみる。
58歳の女性。乳房の腫瘤に気付いたため来院した。乳腺超音波検査を受けたところ異常所見が見られた。乳腺超音波検査の乳癌診断の感度が60%、特異度90%であるとき、この女性が乳癌である可能性はどれか。ただし、有病率は10%とする。
1. 20%
2. 30%
3. 40%
4. 50%
5. 60%
これも分割表を書けば簡単!
病気あり | 病気なし | ||
検査陽性 | |||
検査陰性 | |||
\(10\) | \(90\) | \(100\) |
病気あり | 病気なし | ||
検査陽性 | \(10\times 0.6 = 6\) | ||
検査陰性 | \(90\times 0.9 = 81\) | ||
\(10\) | \(90\) | \(100\) |
病気あり | 病気なし | ||
検査陽性 | \(6\) | \(90-81 = 9\) | |
検査陰性 | \(10-6 = 4\) | \(81\) | |
\(10\) | \(90\) | \(100\) |
病気あり | 病気なし | ||
検査陽性 | \(6\) | \(9\) | \(15\) |
検査陰性 | \(4\) | \(81\) | \(85\) |
\(10\) | \(90\) | \(100\) |
したがって、この女性が乳癌である確率(陽性適中率)は\(\displaystyle \frac{6}{15} = 0.4\)で、\(40\%\)となる。思ったよりも低い、と感じる人が多いのではないだろうか。
リスク比とオッズ比の違い
ここでも分割表を書いてみる。ただし、検査陽性や検査陰性ではなく、曝露陽性・曝露陰性となる。
病気あり | 病気なし | ||
曝露陽性 | \(a\) | \(b\) | \(a+b\) |
曝露陰性 | \(c\) | \(d\) | \(c+d\) |
\(a+c\) | \(90\) | \(a+b+c+d\) |
リスク比(相対危険)、relative riskは「曝露群の疾病頻度/非曝露群の疾病頻度」で定義される。上の表で言うと、\(\displaystyle \left. \frac{a}{a+b}\middle /\frac{c}{c+d} \right.\)となる。
対してオッズ比は、「曝露群のオッズ/非曝露群のオッズ」で定義され、上の表で言うと\(\displaystyle \left. \frac{a}{b} \middle / \frac{c}{d} \right. = \frac{ad}{bc}\)となる。
オッズ比のイメージは以下の図のようになる。
ROC曲線とはなにか
ROC曲線 (Receiver Operating Characteristic)という単語が上に出てきたが、これも検査の感度・特異度に関する話題である。もともと第二次世界大戦中にレーダーシステムの通信工学理論として開発された。レーダー信号のノイズの中から敵機の存在を検出するための方法として開発されたものである。
横軸(\(x\)軸)に「1-特異度」、縦軸(\(y\)軸)に感度をとって描く。検査の判定閾値を変化させたとき、偽陽性と真陽性のトレードオフを表現するためのグラフである。
どういうことかと言うと、例えば下の表のような、検査値と病気かどうかの分布表があるとする。検査値は何でもよく、例えば前立腺癌のマーカーであるPSAと、本当に前立腺癌かどうかなどでもいい。
ID | 検査値(PSA) | 病気(前立腺癌) |
1 | 1.2 | 0 |
2 | 1.4 | 0 |
3 | 2.3 | 0 |
4 | 3.0 | 1 |
5 | 3.5 | 1 |
6 | 4.1 | 1 |
7 | 4.5 | 1 |
8 | 4.8 | 0 |
9 | 5.5 | 1 |
10 | 6.2 | 1 |
次に、検査の閾値を(適当に)設定する。閾値というのは、「検査がこの値以上だったら、病気の可能性がありとスクリーニングし、この値以下だったら病気の可能性は低いとする」という人間が定める境界のことである。ここでは1.0, 2.0, 4.0, 5.0, 6.0の5つの閾値を設定する。この一つ一つの閾値に対して、分割表を作成する。下の例では1.0の場合と5.0の場合を考えてみよう。
病気あり | 病気なし | ||
曝露陽性 | \(6\) | \(4\) | \(10\) |
曝露陰性 | \(0\) | \(0\) | \(0\) |
\(6\) | \(4\) | \(10\) |
この場合、感度は\(1.0\)、特異度は\(0\)になる。
病気あり | 病気なし | ||
曝露陽性 | \(2\) | \(1\) | \(3\) |
曝露陰性 | \(4\) | \(3\) | \(7\) |
\(6\) | \(4\) | \(10\) |
この場合、感度は\(\displaystyle \frac{2}{6} = 0.33\cdots\)、特異度は\(\displaystyle \frac{3}{4} = 0.75\)になる。このように、カットオフを変えながら横軸を「1-特異度」、縦軸を感度にしたグラフを描くと以下のようになる。
一般に、ROC曲線は上に凸の曲線になる。
これを見ると、感度と特異度がトレードオフの関係であることがよく分かる。つまり、感度を上げると特異度は下がるし、特異度を上げると感度は下がる。良い検査とは感度も特異度も高い検査であるので、ROC曲線を考えることは同一検査のカットオフの決定や、あるいは複数の検査の比較を行う際に必須と言えよう。
どのようにカットオフ値を決めるかについてであるが、2通りの決め方がある。一つは、理想的な点からの距離が最も近い曲線を選ぶというものである。
上の図の星から最も近い曲線を選ぶ。もう一つは、Youden indexと呼ばれるもので、上の点線の曲線から最も遠い曲線を選ぶというものである。「1-特異度」を\(x\)、「感度」を\(y\)とすると、直線は\(y = x\)で表される。これを\(x-y = 0\)と変形すると、ある点\((X, Y)\)と直線\(x-y = 0\)との距離は、距離の公式から\(\displaystyle \frac{|X-Y|}{\sqrt{1+1}} = \frac{|X-Y|}{\sqrt{2}}\)となる。これは、感度-(1-特異度)が最も大きくなる直線を探すことに他ならない。
Area Under curve (AUC)とはなにか
上の議論から、曲線の下の面積が大きければ大きいほどモデルの予測能が高いことがわかる。この面積のことをArea Under Curve (ACU)といい、ROC曲線の予測能の判定に用いられる。
一般に次のような基準がよく用いられる。
AUC | 予測能 |
0.9-1.0 | 高い |
0.7-0.9 | 中程度 |
0.5-0.7 | 低い |
感度・特異度の別の解釈の仕方
分割表はわかりやすいが、より視覚的に考えることも可能である。下の図は、健康な人と病気の人で分けて、検査値の分布を示したものである。
人数が多くなれば、分布は正規分布に近づく。健康な人と比べると、病気の人は検査値の平均がより高く、右側にあることがわかる。ただし、よくみると病気の人でも健康な人よりも検査値が低い人もいれば、健康な人でも病気の人よりも検査値が高い人がいることがわかる。
なので、どこから区切りをつける必要がある。これが検査値のカットオフ値である。カットオフを設定すると、どうしても健康な人でも病気と診断されてしまう人(下図の青い部分)や、病気の人でも健康と診断されてしまう人(下図の赤い部分)が現れる。
この青い部分の割合(面積)が、「偽陽性」であり、赤い部分の割合(面積)が偽陰性である。
また、上の図で青い部分は特異度であり、赤い部分は感度であることもわかる。
感度・特異度と確定診断・除外診断との関係
ここは非常に混乱し易いところであるが、感度が高い検査というのは、偽陰性(誤って陰性と判定する確率)が低い検査である。つまり、陽性適中率が高い検査である。なので、感度が高い検査で陰性になった場合、高い確率で病気がないと言える。つまり、感度が高い検査は除外診断に有用である。
一方、特異度が高い検査は、偽陽性(誤って陽性と判定する確率)が低い検査である。つまり、陰性適中率が高い検査である。なので、特異度が高い検査で陽性になった場合、高い確率で病気があると言える。つまり、特異度が高い検査は確定診断に有用である。
陽性尤度比・陰性尤度比
またも分けの分からない言葉が出てきて混乱する人もいるかも知れない。尤度比というのは、「尤もらしさ」のことである。陽性尤度比、と言った場合、「病気の人が病気でない人と比べて、何倍陽性になるのか」を示している。逆に、陰性尤度比というのは、「病気の人が、病気でない人と比べて、何倍陰性になりやすいか」ということを示す。どちらも、病気の人を分子に持ってくることに注意する。
病気あり | 病気なし | ||
検査陽性 | \(a\) | \(b\) | \(a+b\) |
検査陰性 | \(c\) | \(d\) | \(c+d\) |
\(a+c\) | \(b+d\) | \(a+b+c+d\) |
上の表で言うと、陽性尤度比は\(\displaystyle \left. \frac{a}{a+c}\middle/ \frac{b}{b+d} \right.\)となる。ちなみに、定義からこれは「感度/(1-特異度)」になることがわかるだろうか?
陰性尤度比は、\(\displaystyle \left. \frac{c}{a+c}\middle/ \frac{d}{b+d} \right.\)となる。これも少し考えれば、定義から「(1-感度)/特異度」になることがわかる。
じつは、以下のような式が成り立つ。「検査前オッズ\(\times\)尤度比\(=\)検査後オッズ」この公式を用いる際に、尤度比を計算しておくと便利である。検査前オッズは有病率によって変化するが例えば事前確率(有病率)が\(10\%\)のとき、以下のような関係が成り立つことが知られている。
尤度比 | 確率の変化 | 疾患に対するインパクト |
\(10\) | \(45\%\) | かなり高くなる。 |
\(5\) | \(30\%\) | それなりに高くなる。 |
\(2\) | \(15\%\) | 少し高くなる。 |
\(1\) | \(0\%\) | なし! |
\(0.5\) | \(-15\%\) | 少し低くなる。 |
\(0.2\) | \(-30\%\) | それなりに低くなる。 |
\(0.1\) | \(-45\%\) | かなり低くなる |
感度100%、特異度100%の検査は存在するか
これを学生に聞くと、皆一様に「存在しない」と答える。以下の東京大学の解説サイトでさえ存在しないと言い切っている。
しかし、答えは「存在する」である。例えば、色盲でない人がベルトコンベアに乗って流れてくる赤か青のボールのうち、赤だけを選んで箱に入れていくとする。これは感度100%、特異度100%と言っても良いだろう。もちろん現実的な検査では、PCRであれ採血データであれ、分布の重なりが存在するため、感度100%、特異度100%の検査はほぼ存在しないと言っても良いだろう。
コメント