[Statistics]共変量と交絡因子

white caution cone on keyboard statistics
Photo by Fernando Arcos on Pexels.com

暴露因子と結果

興味の対象である変数は曝露因子(exposure)結果(outcome)に分けられる。このうち、曝露因子は独立変数で、結果は従属変数となる。

いちど曝露因子と結果を決定したら、その他の変数は、それが測定されていてもいなくても、共変量(covariates)になる。共変量はいくつかに分類されるが、分類が重複することもある。

交絡因子

【交絡因子(confounders)】DAG (Directed acyclic graph)を見るのが早い。

xはexposure、yはoutcome、zがconfounder

曝露因子、結果の上流にあって、どちらにも影響を与えるものが交絡因子となる。例えば、よくある例だが、Xが飲酒、Yが発癌とする。この時、飲酒者では発癌率が高くなるように考えるが、Zとして喫煙を考えると、「喫煙者では飲酒率が高く(ZからXへの矢印)」、「喫煙者では発癌率が高い(ZからYへの矢印)」と考えるのはreasonableである。実際に、喫煙の有無で調整してみると、飲酒者と非飲酒者で発癌率に差がないことが分かる。

調整因子

【調整因子(mediators)】曝露因子と結果の中間にある変数である。

Xはexposure、Mが調整因子、Yが結果

例えば、XがSLE(全身性エリテマトーデス)、Yが骨粗鬆症とする。SLEの治療ではステロイドを用いるが、ステロイド内服者では骨粗鬆症リスクが高くなることが知られている。この場合、ステロイド内服はSLEに対して、骨粗鬆症の調整因子である。ステロイドを内服しているから、SLEになるわけではない。DAGでは時間的に先行するものを上流(左側)に記載することに注意。

共通効果(Collider)

【共通効果(Collider)】例えば、バスケットボールのチームでレギュラーであることを考える。このチームでは「背の高い人」あるいは「スピードのある人」を選手として選ぶ基準にしている。一般的には、背の高さとスピードの速さに相関はないと考えられる。この場合、レギュラーに限って解析すると、背の高さとスピードの速さに見せかけの負の関連が発見されることがある。これが共通効果 (Collider)である。

Colliderの例。

よりわかりやすくするため、次のような表を見てみる。

HeightSpeedRegular
A180121
B180121
C180130
D180130
E160101
F160101
G160150
H160150
Colliderの説明のためのテーブル。

レギュラーメンバーに限った解析を行うと、背の高さとスピードの間に見せかけの負の関係が生じる用に見える。以下の図がJAMAに掲載されたものであるが、わかりやすい。

M. J. Holmberg, L. W. Andersen, JAMA(2022)

調整因子 (by proxy)

【代理交絡因子】それ自身が交絡因子ではないが、交絡因子と曝露因子、あるいは交絡因子と結果との間に存在する共変量のことである。

Xがexposure、Yがoutcome、Mはproxy confounderかつmediator、Zがconfounderで、Pがproxy confounder

ここで、上図のMは調整因子かつ代理交絡因子になっている。

競合暴露因子

【競合曝露因子】これは図だけ。

Xがexposure、Yがoutcome、Zがcompeting exposure

Moderation model

これは知らなかった。

Moderation (statistics) - Wikipedia

図では以下。

Moderation model。

具体的な例としては、Xはある遺伝子、YはBMI、Zはバースコホートとする。バースコホートが経るにつれて、より脂質の多い食事が若いうちから簡単に摂取できるようになり、体重が増えるという例があげられる。実際に、米国など先進国では過去数十年にわたりBMIは一貫して増え続けている。相互作用という点でバースコホートごとのBMIはXというgenotypeに依存している。BMIの遺伝的素因が異なる個人は、BMIに対する出生コホートの効果に差が生じる。

コメント

タイトルとURLをコピーしました