Causal Inference: What if
第4章。
1-3章はこちら。
Causal Inference: What if
CI: What If (Chap. 2)
CI: What If (Chap. 3)
Part I Causal inference without models
Chapter 4 EFFECT MODIFICATION
ここまでは、対象となる母集団全体における平均的な因果効果に焦点を当ててきた。しかし、因果関係のある質問の多くは、母集団の部分集合に関するものである。「ある人が空を見上げると、他の歩行者も空を見上げるようになるか?」という因果関係の質問をもう一度考えてみよう。あなたは、歩行者の集団全体における平均的な効果ではなく、都市に住む人と観光客に分けて、治療の平均的な因果効果(あなたが空を見上げること)を計算することに興味があるかもしれない。
母集団全体の平均効果を計算するか、部分集合の平均効果を計算するかは、推論目的によって決まる。場合によっては、個人の異なるグループ間の効果のばらつきを気にしないかもしれない。たとえば、あなたが全国的な水フッ素化プログラムの実施の可能性を検討している政策立案者であるとする。この公衆衛生介入は母集団の全世帯に及ぶので、あなたの第一の関心は、特定の部分集合ではなく、母集団全体における平均的な因果効果にある。あなたは、介入を異なる部分集合に的を絞ることができる場合、または研究の結果を他の集団に適用する必要がある場合に、因果効果が集団の部分集合間でどのように異なるかを特徴付けることに関心があるだろう。
本章では、治療の因果効果というものは存在しないことを強調する。むしろ、因果効果は研究対象の特定の集団の特徴に依存する。
4.1 Definition of effect modification
本書では、ゼウスの拡大家族20人の集団における心臓移植\(A\)が死亡\(Y\)に及ぼす因果効果の平均を計算することから始めた。表1.1のデータを使用した。その列は、(一般に未観測の)反事実結果\(Y^{a = 0}\)と\(Y^{a = 1}\)の個々の値を示している。
\(V\) | \(Y^0\) | \(Y^1\) | |
Rheia | 1 | 0 | 1 |
Demeter | 1 | 0 | 0 |
Hestia | 1 | 0 | 0 |
Hera | 1 | 0 | 0 |
Artemis | 1 | 1 | 1 |
Leto | 1 | 0 | 1 |
Athena | 1 | 1 | 1 |
Aphrodite | 1 | 0 | 1 |
Persephone | 1 | 1 | 1 |
Hebe | 1 | 1 | 0 |
Kronos | 0 | 1 | 0 |
Hades | 0 | 0 | 0 |
Poseidon | 0 | 1 | 0 |
Zeus | 0 | 0 | 1 |
Apollo | 0 | 1 | 0 |
Ares | 0 | 1 | 1 |
Hephaestus | 0 | 0 | 1 |
Cyclope | 0 | 0 | 1 |
Hermes | 0 | 1 | 0 |
Dionysus | 0 | 1 | 0 |
表1.1のデータを検討した結果、平均因果効果は無効であると結論づけられた。もし全員が心臓移植を受けていれば、集団の半数は死亡していたであろう(\(\text{Pr}[Y^{a=1} = 1] = 10/20 = 0.5\))。また、もし誰も心臓移植を受けていなければ、集団の半数は死亡していたであろう(\(\text{Pr}[Y^{a=0} = 1] = 10/20 = 0.5\))。因果リスク比\(\text{Pr}[Y^{a=1}=1]/\text{Pr}[Y^{a=0}=1]\)は\(0.5/0.5=1\)であり、因果リスク差\(\text{Pr}[Y^{a=1}=1]-\text{Pr}[Y^{a=0}=1]\)は\(0.5-0.5=0\)であった。
次に、2つの新たな因果関係を考察する。女性における\(A\)の\(Y\)に対する平均的な因果効果は何か?そして男性では?この表には、表1.1と同じ情報に加え、性別を表す指標\(V\)が1列追加されている。便宜上、最初の10行を女性、最後の10行を男性が占めるように表を並べ替えた。
まず、女性の平均因果効果を計算してみよう。そのためには、\(V = 1\)の表の最初の10行に分析を限定する必要がある。この部分集合では、治療下の死亡リスクは\(\text{Pr}[Y^{a=1} = 1|V = 1] = 6/10 = 0.6\)であり、無治療下の死亡リスクは\(\text{Pr}[Y^{ a=0} = 1|V = 1] = 4/10 = 0.4\)である。因果リスク比は\(0.6/0.4=1.5\)であり、因果リスク差は\(0.6-0.4=0.2\)である。つまり、平均して心臓移植\(A\)は女性の死亡リスクを\(Y\)増加させる。
次に、男性における平均因果効果を計算してみよう。この部分集合では、治療下の死亡リスクは\(\text{Pr}[Y^{a=1} = 1|V = 0] = 4/10 = 0.4\)であり、無治療下の死亡リスクは\(\text{Pr}[Y^{a=0} = 1|V = 0] = 6/10 = 0.6\)である。因果リスク比は\(0.4/0.6=2/3\)であり、因果リスク差は\(0.4-0.6=-0.2\)である。つまり、平均して心臓移植\(A\)は男性の死亡リスク\(Y\)を減少させる。
この例は、母集団における平均的因果効果の帰無が、母集団の特定の部分集合における平均的因果効果の帰無を意味しないことを示している。表4.1では、平均的因果効果がないという帰無仮説は母集団全体では成り立つが、男女別に見ると成り立たない。たまたま、男性と女性の平均的因果効果の大きさは等しいが、方向は逆なのである。それぞれの性別の割合は50%なので、母集団全体を考慮すると、両方の効果は正確に相殺される。効果の正確な相殺はおそらくまれであろうが、治療に対する個人の感受性のばらつきのために、治療の個々の因果効果の不均一性はしばしば予想される。因果効果がないという鋭い帰無仮説が真である場合は例外である。その場合、効果はすべての個体でnullであり、したがって母集団のどの部分集合における平均因果効果もnullであるため、効果の異質性は存在しない。
これで効果修飾語の定義を提供する準備ができた。\(Y\)に対する\(A\)の平均因果効果が、\(V\)の水準によって異なるとき、\(V\)は\(Y\)に対する\(A\)の効果の修飾子であると言う。平均的因果効果は、異なる効果尺度(例えば、リスク差、リスク比)を用いて測定できるので、効果修飾の有無は、使用される効果尺度に依存する。例えば、性別\(V\)は、加法的尺度の死亡率\(Y\)に対する心臓移植\(A\)の効果の効果修飾因子である。また、性別\(V\)は、因果リスク比が\(V\)のレベル間で変化するため、乗法スケールにおいて、死亡率\(Y\)に対する心臓移植\(A\)の効果の効果修飾因子である。我々は、効果修飾因子として、治療\(A\)によって影響されない変数\(V\)だけを考慮する。
表4.1では、因果リスク比は女性で\(1\)より大きく(\(V=1\))、男性で\(1\)より小さい(\(V=0\))。同様に、因果リスク差は女性で\(0\)より大きく(\(V=1\))、男性で\(0\)より小さい(\(V=0\))。つまり、\(V = 1\)と\(V = 0\)の部分集合の平均因果効果は反対方向であるため、質的効果修飾が存在する。質的効果修正がある場合、加法的効果修正は乗法的効果修正を意味し、逆もまた同様である。しかし、質的効果修飾がない場合、一方の尺度(例えば、乗法的)では効果修飾が見られるが、他方の尺度(例えば、加法的)では見られないことがある。この点を説明するために、2番目の研究で、この線の左側に示した量を計算したとしよう。すなわち、\(0.9 – 0.8 = 0.1 = 0.2 – 0.1\)である。しかし、この研究では、\(V=1\)の個体間の因果リスク比と\(V=0\)の個体間の因果リスク比が異なるため、\(V\)による乗法的な効果修飾がある、すなわち、\(0.9/0.8=1.1 \ne 0.2/0.1 = 2\)である。一般的に、使用されている効果尺度(例えば、リスク差、リスク比)に言及せずに、効果修飾があるともないとも言えないので、著者によっては、効果尺度の選択に対する概念の依存性を強調するために、効果修飾ではなく、効果尺度修飾という用語を使用している。
4.2 Stratification to identify effect modification
層別分析は、効果修正を識別する自然な方法である。\(V\)が\(Y\)に対する\(A\)の因果効果を修正するかどうかを決定するために、変数\(V\)の各レベル(層)における\(Y\)に対する\(A\)の因果効果を計算する。前節では、表4.1のデータを用いて、性\(V\)の2つの層それぞれにおける移植\(A\)の死亡\(Y\)に対する因果効果を計算した。表4.1 のデータを用いて、性\(V\) の2つの層ごとに、死亡\(Y\) に対する移植\(A\)の因果効果を計算したところ、2つの層で(相加的、相乗的)因果効果が異なっていたことから、\(Y\) に対する\(A\)の因果効果には\(V\) による(相加的、相乗的)効果修飾があると結論した。
しかし、表4.1のデータは、実生活で遭遇する典型的なデータではない。各個人の反事実結果\(Y^{a=1}\)と\(Y^{a=0}\)の2列の代わりに、各個人の治療水準\(A\)と観察結果\(Y\)の2列がある。反事実転帰が得られないことは、効果修正を検出するための層別化の使用にどのように影響するのだろうか?答えは研究デザインによる。
まず理想的なランダム化実験を考えてみよう。第2章では、ランダムな変動はさておき、治療の平均的な因果効果は観察されたデータを使って計算できることを示した。例えば、因果リスク差\(\text{Pr}[Y^{a=1} = 1] – \text{Pr}[Y^{a=0} = 1]\)は、観察された関連リスク差\(\text{Pr}[Y = 1|A = 1] – \text{Pr}[Y = 1|A = 0]\)に等しい。治療割り付けが無作為かつ無条件であれば、集団のすべての部分集合で交換可能性が予想されるため、同じ推論を変数\(V\)の各層に拡張することができる。したがって、女性における因果的リスク差\(\text{Pr}[Y^{a=1} = 1|V = 1] – \text{Pr}[Y^{a=0} = 1|V = 1]\)は、女性における連合的リスク差\(\text{Pr}[Y = 1|A = 1,V = 1]-\text{Pr}[Y = 1|A = 0,V = 1]\)に等しい。男性についても同様である。したがって、無条件無作為化を用いた理想的な実験において、\(V\)による効果修飾を同定するには、層別分析を実施すればよい。層別化は、母集団の部分集合における平均的な因果効果を計算するために使用できるが、個々の効果は計算できない(Fine Point 2.1と3.2を参照)。
ここで、条件付き無作為化を用いた理想的な無作為化実験を考えよう。40人の母集団において、移植\(A\)は確率\(0.75\)で重症者(\(L = 1\))に、確率\(0.50\)でそれ以外(\(L = 0\))に無作為に割り当てられている。40人はパスポートによって2つの国籍に分類される。 20人はギリシャ人(\(V = 1\))、20人はローマ人(\(V = 0\))である。ギリシャ人20人の\(L, A\)、死亡\(Y\)のデータを表2.2に示す(表3.1と同じ)。20人のローマ人のデータを表4.2に示す。治療下の集団リスク\(\text{Pr}[Y^{ a=1} = 1]\)は\(0.55\)であり、無治療下の集団リスク\(\text{Pr}[Y^{a=0} = 1]\)は\(0.40\)である。(どちらのリスクも、標準化またはIP重み付けのいずれかを用いれば容易に計算できる。詳細は読者に委ねる)。したがって、死亡\(Y\)に対する移植\(A\)の平均因果効果は、リスク差尺度では\(0.55-0.40=0.15\)であり、リスク比尺度では\(0.55/0.40=1.375\)である。この集団では、心臓移植は死亡リスクを増加させる。
\(L\) | \(A\) | \(Y\) | |
Rheia | 0 | 0 | 0 |
Kronos | 0 | 0 | 1 |
Demeter | 0 | 0 | 0 |
Hades | 0 | 0 | 0 |
Hestia | 0 | 1 | 0 |
Poseidon | 0 | 1 | 0 |
Hera | 0 | 1 | 0 |
Zeus | 0 | 1 | 1 |
Artemis | 1 | 0 | 1 |
Apollo | 1 | 0 | 1 |
Leto | 1 | 0 | 0 |
Ares | 1 | 1 | 1 |
Athena | 1 | 1 | 1 |
Hephaestus | 1 | 1 | 1 |
Aphrodite | 1 | 1 | 1 |
Cyclope | 1 | 1 | 1 |
Persephone | 1 | 1 | 1 |
Hermes | 1 | 1 | 0 |
Hebe | 1 | 1 | 0 |
Dionysus | 1 | 1 | 0 |
\(L\) | \(A\) | \(Y\) | |
Cybele | 0 | 0 | 0 |
Saturn | 0 | 0 | 1 |
Ceres | 0 | 0 | 0 |
Pluto | 0 | 0 | 0 |
Vesta | 0 | 1 | 0 |
Neptune | 0 | 1 | 0 |
Juno | 0 | 1 | 1 |
Jupiter | 0 | 1 | 1 |
Diana | 1 | 0 | 0 |
Phoebus | 1 | 0 | 1 |
Latona | 1 | 0 | 0 |
Mars | 1 | 1 | 1 |
Minerva | 1 | 1 | 1 |
Vulcan | 1 | 1 | 1 |
Venus | 1 | 1 | 1 |
Seneca | 1 | 1 | 1 |
Proserpina | 1 | 1 | 1 |
Mercury | 1 | 1 | 0 |
Juventas | 1 | 1 | 0 |
Bacchus | 1 | 1 | 0 |
前章で述べたように、条件付交換可能性\(Y^a\mathop{\perp\!\!\!\!\perp} A|L\)が成立すると考えられる観察研究から得られたデータであれば、因果効果の計算は同じであっただろう。
ここで、国籍\(V\)が\(Y\)に対する\(A\)の効果を修正するかどうかを調べるために、層別分析をどのように行うかを議論する。その目的は、ギリシャ人においては\(\text{Pr}[Y^{a=1} =1|V =1]-\text{Pr}[Y^{a=0} =1|V =1]\)、ローマ人においては\(\text{Pr}[Y^{a=1} = 1|V =0]-\text{Pr}[Y^{a=0} = 1|V = 0]\)という\(Y\)に対する\(A\)の因果効果を計算することである。この2つの因果的リスク差が異なる場合、\(V\)による相加的効果修飾があると言う。また、乗法的効果修飾に関心がある場合は、因果リスク比についても同様である。
各層\(v\)における条件付きリスク\(\text{Pr}[Y^{a =1} = 1|V = v]\)と\(\text{Pr}[Y^{a =0} = 1|V = v]\)を計算する手順は2段階ある。1)\(V\)による層別化,2)\(L\)による標準化(または、同等に\(L\)に依存する重みによるIP重み付け)である。第2章では、ギリシャ層(\(V = 1\))における標準化リスクを計算した。因果リスク差は\(0\)、因果リスク比は\(1\)であった。ローマ層(\(V = 0\))でも同じ手順で、リスク\(\text{Pr}[Y^{a=1} = 1|V = 0] = 0.6\)、\(\text{Pr}[Y^{a=0} = 1|V = 0] = 0.3\)を計算できる。したがって、層\(V=0\)では、因果リスク差は\(0.3\)、因果リスク比は\(2\)である。これらの効果測定は層\(V=1\)とは異なるので、移植\(A\)の死亡\(Y\)に対する効果には、国籍\(V\)による相加的効果修飾と相乗的効果修飾の両方があると言う。この効果修飾は、層\(V =0\)と\(V =1\)の両方で効果が有害または無効であるため、定性的なものではない。
われわれの研究集団では、国籍\(V\)が死亡リスク\(Y\)に対する心臓移植\(A\)の効果を修飾することを示した。しかし、このような効果修飾に関与する因果メカニズムについては、何ら主張していない。実際、国籍が効果の修正に本当に関与している因果因子の単なるマーカーである可能性もある。例えば、心臓手術の質がローマよりギリシャの方が高いとする。その場合、国籍による効果の修飾が見られるだろう。ローマでの心臓手術の質を向上させるための介入を行えば、パスポートで定義された国籍による因果効果の修飾をなくすことができる。この区別を強調したいときはいつでも、国籍を代理効果修飾子、医療の質を因果効果修飾子と呼ぶことにする。
したがって、\(V\)による効果修正という用語を使用することは、必ずしも\(V\)が効果の修正において因果的な役割を果たしていることを意味するものではない。混乱を避けるために、著者によっては “effect modification by \(V\)”ではなく、より中立的な “effect heterogeneity across strata of \(V\)”という用語を使うことを好む。次の章では、効果修飾に関連する概念である「相互作用」を紹介するが、これは関係する変数に因果的役割を帰属させるものである。
Fine Point 4.1 「被治療者への影響」
この章では、母集団の部分集合における平均的因果効果について述べる。ある特定の部分集合は、被治療者(\(A = 1\))である。 もし\(\text{Pr}[Y^{a=1} = 1|A = 1] \ne \text{Pr}[Y^{a=0} =1|A = 1]\)であれば、または整合性によって、もし$$\text{Pr}[Y =1|A = 1]\ne \text{Pr}[Y^{a=0} =1|A = 1]$$であれば、被処理者の平均因果効果はnullではない。つまり、被治療者の間で観察されたリスクが、被治療者が無治療であった場合の反事実リスクと等しくない場合、被治療者に因果効果がある。被治療者の因果リスク差は、\(\text{Pr}[Y = 1|A = 1] – \text{Pr}[Y^{a=0} = 1|A = 1]\)である。治療された人の因果リスク比は、標準化罹患率比(SMR)としても知られ、\(\text{Pr}[Y = 1|A = 1]/ \text{Pr}[Y^{a=0} = 1|A = 1]\)である。未治療のリスク差とリスク比は、\(A=1\)を\(A=0\)に置き換えることで同様に定義される。図4.1は、治療群と非治療群の効果を比較したものである。個々の因果効果の分布が治療群と未治療群で異なれば、治療群の平均効果は母集団の平均効果とは異なる。つまり、被治療者における効果を計算するとき、被治療群と未治療群との間の効果の修正に本当に責任がある要因の目印として、治療群\(A=1\)が使われる。しかし、たとえ\(V\)が原因効果修飾因子の代理(たとえば国籍)であるにすぎないとしても、治療前変数\(V\)による効果修飾があると言うことはできても、治療\(A\)による効果\(A\)の修飾があるとは、紛らわしく聞こえるので言わないであろう。真の効果修飾因子と代理効果修飾因子のグラフ表現については、セクション6.6を参照。本書の大部分は、母集団における因果効果に焦点が当てられている。なぜなら、治療された人における因果効果や、治療されていない人における因果効果は、時間変動する治療に対して直接一般化することができないからである(第III部参照)。
4.3 Why care about effect modification
研究者が効果修飾の同定に関心を持つ理由、そして無作為化実験においても治療前の記述子\(V\) に関するデータを収集することが重要である理由は、いくつか関連している。
第一に、要因\(V\)が結果\(Y\)に対する治療\(A\)の効果を修正する場合、平均因果効果は\(V\)の有病率が異なる集団間で異なる。例えば、表4.1の集団における平均因果効果は、女性では有害で男性では有益である。男女各50%の個体が存在し、男女別の有害効果と有益効果は等しいが符号は逆であるため、集団全体の平均因果効果は無効である。しかし、もし私たちが女性の割合が高い集団(例えば、卒業した大学生)で研究を実施していたら、集団全体の平均因果効果は有害であったであろう。非定量的効果修飾が存在する場合、平均的因果効果の大きさは、方向ではなく、集団によって異なる可能性がある。非定量的効果修飾の例として、アスベスト暴露の効果(喫煙者と非喫煙者で異なる)と国民皆保険の効果(低所得家庭と高所得家庭で異なる)を考えてみよう。
つまり、母集団における平均的な因果効果は、母集団における個々の因果効果の分布に依存する。一般に、「結果\(Y\)(期間)に対する治療\(A\)の平均的因果効果」というものは存在せず、「因果効果修飾因子の特定の組み合わせを持つ集団における結果\(Y\)に対する治療\(A\)の平均的因果効果」である。
Technical Point 4.1 「被治療者の効果を計算する」
我々は、\(a = 0\)と\(a = 1\)の両方について、条件付交換可能性\(Y^a \mathop{\perp\!\!\!\!\perp} A|L\)の下で母集団における平均因果効果を計算した。被治療者における平均因果効果の計算には、部分的交換可能性\(Y^{a = 0}\mathop{\perp\!\!\!\!\perp}A|L\)のみが必要である。言い換えれば、未治療者のリスクが、実際に治療を受けた人のリスクと等しいかどうかは関係ない。未治療者の平均因果効果は、部分交換可能性条件\(Y^{a=1}\mathop{\perp\!\!\!\!\perp}A|L\)のもとで計算される。次に、上記の部分交換可能性の仮定の下で、標準化によって、またIP重み付けによって、反事実平均\(\text{E}[Y^a |A = a^{\prime}]\)を計算する方法を説明する。
・標準化:\(\text{E}[Y^a|A = a^{\prime}]\) は \(\displaystyle \sum_{l}^{\text{E}[Y|A = a, L = l]\text{Pr}[L=l|A = a^{\prime}]}\)に等しい。Miettinen (1972) および Greenland and Rothman (2008) を参照。
・IP重み付け:\(\text{E}[Y^a|A = a^{\prime}]\)は重み\(\displaystyle \frac{\text{Pr}[A = a^{\prime} | L]}{f(A|L)}\)に対して、IP重み付け平均$$\frac{\text{E}\left[\frac{I(A = a) Y}{f(A|L)}\text{Pr}[A = a^{\prime} | L]\right]}{\text{E}\left[\frac{I(A = a)}{f(A|L)}\text{Pr}[A = a^{\prime}|L]\right]}$$と等しい。二項変数\(A\)については、この等式は佐藤と松山(2003)によって導かれた。詳細はHernán and Robins (2006)を参照。
ある母集団で計算された因果効果の第二の母集団への外挿は、母集団を超えた因果推論の可搬性と呼ばれる(Fine Point 4.2参照)。この例では、死亡リスク\(Y\)に対する心臓移植\(A\)の因果効果は、男性と女性、ローマ人とギリシャ人で異なる。したがって、この集団における平均的な因果効果は、性別や国籍などの効果修飾因子の分布が異なる他の集団には移植できない可能性がある。
効果修飾子によって定義された層における条件付き因果効果は、母集団全体における因果効果よりも移送可能かもしれないが、ある母集団における条件付き効果測定値が、別の母集団における条件付き効果測定値と等しいという保証はない。これは、2つの母集団間で条件付分布が異なる(またはFine Point 4.2で述べた他の理由による)未測定の、または未知の原因効果修飾因子が存在する可能性があるからである。これらの測定されていない効果修飾因子は、交換性を達成するために必要な変数ではなく、結果のリスク因子にすぎない。したがって、集団間の効果の伝達可能性は、単一集団における因果効果の同定よりも困難な問題である。交換可能性を達成するために必要なすべてのもの(例えば、治療法の割り当てを決定する人々にインタビューすることによって、情報を得ることができるかもしれない)だけでなく、はるかに少ない情報しかない結果の測定されていない原因についても層別化する必要がある。
したがって、因果効果の伝達可能性は、対象分野の知識に大きく依存する検証不可能な仮定である。例えば、ニジェールの世帯の年間所得を100ドル増加させることによる健康効果(相加的または相乗的スケール)をオランダに伝達することはできないが、ヨーロッパ人のコレステロール低下薬の使用による健康効果をカナダ人に伝達することは可能であることに、ほとんどの専門家が同意するであろう。
第二に、効果修正の有無を評価することは、介入から最も恩恵を受けるであろう個人のグループを特定するのに役立つ。表4.1の例では、結果\(Y\)に対する治療\(A\)の平均因果効果は無効であった。しかし、治療\(A\)は男性では有益な効果を示し(\(V = 0\))、女性では有害な効果を示した(\(V = 1\))。もし医師が、性別による効果の質的修飾があることを知っていれば、追加情報がない限り、次の患者がたまたま男性であった場合にのみ治療を行うだろう。2番目の例のように、相加的ではなく相乗的な効果修飾がある場合、状況は少し複雑になる。すなわち、因果的なリスク差は\(V\)のすべてのレベルにおいて\(0.1\)であるため、\(V\)による相加的な効果修飾はない。したがって、すべての患者を治療する介入は、乗法的な効果修飾があるにもかかわらず、\(V\)の両方の層でリスクを減少させるのに等しく効果的であろう。実際、\(V\)の少なくとも1つの層でゼロでない因果効果があり、反事実リスク\(\text{Pr}[Y^{a = 0} = 1|V = v]\)が\(v\)によって変化する場合、効果修飾は相加的または相乗的尺度のいずれかで保証される。
加法的な効果修飾はあるが、乗法的な効果修飾はない。相加的な効果修飾がない場合、相乗的な効果修飾があることを知ることは通常あまり役に立たない。
我々の2番目の例では、乗法的効果修正の存在は、層\(V = 1\)の無治療のリスクは\(0.8\)に等しいので、\(V = 1\)の層で可能な最大因果リスク比は\(1/0.8 = 1.25\)であるという数学的事実から導かれる。したがって、\(V = 1\)層での因果リスク比は、\(V = 0\)層での因果リスク比\(2\)とは異なることが保証される。このような状況では、乗法的効果修飾の存在は、単に無処置の下でのリスク\(\text{Pr}[Y^{a=0} = 1|V = v]\)が\(V\)の水準間で異なることの結果である。したがって、一般的なルールとして、\(V\)の各水準\(v\)における(絶対)反事実リスク\(\text{Pr}[Y^{ a=1} = 1|V = v]\)と\(\text{Pr}[Y^{a=0} = 1|V = v]\)を報告する方が、単にそれらの比や差よりも有益である。
最後に、効果修飾の同定は、生物学的、社会的、または結果につながるその他のメカニズムの理解に役立つかもしれない。例えば、割礼を受けていない男性では割礼を受けている男性に比べてHIV感染のリスクが高いということは、この病気を理解するための新たな手がかりとなるかもしれない。効果修飾の同定は、2つの治療間の相互作用を特徴づけるための第一歩となるかもしれない。効果修飾」と「相互作用」という用語は、科学文献では同義語として使われることがある。本章では 「効果修飾」に焦点を当てた。次の章では、「効果修飾」とは異なるが、「効果修飾」 に関連する因果概念としての 「相互作用」について述べる。
4.4 Stratification as a form of adjustment
この章まで、我々の唯一の目標は、母集団全体における平均因果効果を計算することであった。マージナル無作為化がない場合、この目標を達成するためには、治療者と非治療者の条件付変化可能性を保証する変数\(L\)の調整が必要である。例えば、第2章では、死亡率\(Y\)に対する心臓移植\(A\)の平均因果効果はnull、すなわち、因果リスク比\(\text{Pr}[Y{a=1} =1/\text{Pr}[Y^{a=0} =1]=1\)と決定した。表2.2のデータを用いて、標準化とIP重み付けの両方によって因子\(L\)を調整した。
本章では、分析にもう一つの潜在的な目標を追加する。例えば、この章では、死亡\(Y\)に対する心臓移植\(A\)の平均因果効果がギリシャ人とローマ人で異なることを決定するために、\(L\)で調整する前に\(V\)で層別化する必要がある。要約すると、標準化(またはIP重み付け)は\(L\)を調整するために使用され、層別化は\(V\)による効果の修正を同定するために使用される。
Fine Point 4.2 「可搬性」
ある母集団で推定された因果効果は、しばしば別の母集団(ここでは対象母集団と呼ぶ)での意思決定を意図している。交換可能性、正値性、一貫性のもとで、調査集団における治療の平均的因果効果を正しく推定したとする。その効果は対象集団でも同じだろうか?つまり、効果を調査集団から対象集団に「輸送」できるだろうか?この質問に対する答えは、両集団の特徴に依存する。具体的には、2つの集団間で以下の特性が類似している場合、1つの集団から別の集団への効果の伝達性が正当化される可能性がある。
・効果修正:治療による因果効果は、結果に対する感受性の異なる個人間で異なる可能性がある。例えば、女性が男性よりも治療の影響を受けやすい場合、性別が効果修飾因子であると言う。ある集団における効果修飾因子の分布は、一般にその集団における治療の因果効果の大きさに影響する。もし効果修飾因子の分布が調査集団と対象集団で異なれば、治療の因果効果の大きさも異なるであろう。
・治療のバージョン:治療の因果効果は、集団における治療のバージョン分布に依存する。この分布が調査集団と対象集団で異なれば、治療の因果効果の大きさも異なる。
・干渉:本文では、干渉のない設定(Fine Point 1.1)に焦点を当ててきた。しかし、ある個人の治療が集団内の他の人の結果に影響を及ぼす可能性があるため、干渉が存在する可能性があることを忘れてはならない。例えば、社会的に活動的な個人は、運動しているときに友人を説得して参加させることがあり、そのため、その個人の身体活動に対する介入は、社会的に孤立した個人に対する介入よりも効果的である可能性がある。したがって、個人間の接触パターンが因果効果の大きさに影響する可能性がある。接触パターンが調査集団と対象集団で異なれば、治療の因果効果の大きさも異なるであろう。
効果修飾子によって定義された層における平均的な因果効果に注意を限定したり、対象集団における平均的な因果効果を再構成するために調査集団における層特異的効果を用いることによって、集団間の因果推論の可搬性が改善されることがある。例えば、我々の母集団における4つの層別効果指標(ローマ人女性、ギリシャ人女性、ローマ人男性、ギリシャ人男性)を加重平均で組み合わせることで、性別と国籍の組み合わせが異なる別の母集団における平均因果効果を再構成することができる。各層別の指標に割り当てられた加重は、2番目の集団におけるその層の個人の割合である。しかし、未測定の効果修飾因子の分布、干渉パターン、治療のバージョンの分布など、集団間の違いがありうるため、この再構成された効果が、対象集団における真の効果と一致するという保証はない。
しかし、層別化は必ずしも\(V\)による効果修飾を同定するために用いられるわけではない。実際には、層別化は\(L\)を調整するための標準化(およびIP重み付け)の代替としてしばしば使用される。実際、\(L\)を調整する方法としての層別化の使用は非常に広まっており、多くの研究者は「層別化」と「調整」という用語を同義語として考えている。例えば、心臓移植\(A\)が死亡率\(Y\)に及ぼす影響を計算するために、ある疫学者に因子\(L\)の調整を依頼したとする。彼女はすぐに表2.2を\(L = 0\)の個体と\(L = 1\)の個体に限定した2つの小表に分割し、それぞれの効果指標(例えばリスク比)を提供するだろう。すなわち、\(l=0\)と\(l=1\)の両方についてリスク比\(\text{Pr}[Y =1|A=1, L=l]/\text{Pr}[Y =1|A=0, L=l]=1\)を計算する。
これらの2つの層特異的関連リスク比は、\(L\)が与えられた条件付交換可能性のもとで、因果的解釈を与えることができる。それぞれ、\(L = 0\)と\(L = 1\)で定義される母集団の部分集合における平均的因果効果を測定する。これらは条件付効果測定である。対照的に、第2章で計算したリスク比\(1\)は、マージナル(非条件)効果尺度である。この特定の例では、\(L\)による効果修正がないので、3つのリスク比(2つの条件付きリスク比とマージナルリスク比)すべてが等しくなる。層別化は、必然的に複数の層別効果尺度(変数\(L\)によって定義される層ごとに1つ)をもたらす。それらの各々は、母集団の重複しない部分集合における平均因果効果を定量化するが、一般に、母集団全体における平均因果効果を定量化するものはない。したがって、第2章で母集団における治療の平均因果効果を計算する方法を説明する際、層別化は考慮しなかった。むしろ、標準化とIP重み付けに焦点を当てた。
さらに、標準化やIP重み付けとは異なり、層別化による調整では、条件付交換可能性に必要なすべての変数\(L\)の組み合わせによって定義された母集団の部分集合における効果測定を計算する必要がある。例えば、表2.2および表4.2の母集団における心臓移植の効果を推定するために層別化を用いる場合、\(L = 1\)のローマ人、\(L = 1\)のギリシャ人、\(L = 0\)のローマ人、\(L = 0\)のギリシャ人における効果を計算しなければならないが、国籍\(V\)はそれだけでは条件付交換性を保証するには不十分であるため、層\(V = 0\)における関連を計算するだけではローマ人における効果を計算することはできない。
すなわち、層別化の使用は、そのような効果修飾に関心があるかどうかにかかわらず、条件付き交換性を達成するために必要なすべての変数\(L\)による効果修飾を評価することを強いる。対照的に、\(V\)による層別化と、\(L\)を調整するためのIP重みづけまたは標準化は、上述のように、交換可能性と効果修正を別々に扱うことを可能にする。
層別化の使用に関連する他の問題は、オッズ比のような特定の効果測定の非協同性(Fine Point 4.1参照)、および時変治療の場合、先行治療の影響を受ける時変変数\(L\)の調整が必要な場合にバイアスにつながる不適切な調整である(第III部参照)。
調査者は、変数\(L\)によって定義される層のいくつかにおいてのみ因果効果を計算することがある。このような層別化は、制限として知られている。因果推論では,層化は,単純に,母集団のいくつかの包括的で相互に排他的な部分集合に制限を適用することであり,これらの部分集合のそれぞれ内で交換可能である.母集団のいくつかの層で陽性が得られない場合、限定は因果推論を元の母集団の陽性が得られる層に限定するために使われる(第3章参照)。
4.5 Matching as another form of adjustment
マッチングは、もう1つの調整手法である。マッチングの目的は、変数\(L\)が治療群と非治療群の両方で同じ分布を持つ母集団の部分集合を構築することである。例として、変数\(L\)が条件付交換可能性を達成するのに十分な表2.2の心臓移植の例を見てみよう。非重症状態の各未治療個体(\(A = 0, L = 0\))に対して、非重症状態の治療個体(\(A = 1, L = 0\))を無作為に選択し、重症状態の各未治療個体(\(A = 0, L = 1\))に対して、重症状態の治療個体(\(A = 1, L = 1\))を無作為に選択する。各未治療個体と対応する治療個体をマッチド・ペアと呼び、変数Lをマッチング因子と呼ぶ。以下の7組のマッチしたペアを形成したとする。Rheia-Hestia、Kronos-Poseidon、Demeter-Hera、Hades-Zeusは\(L=0\)、Artemis-Ares、Appolo-Aphorodite、Leto-Hermesは\(L=1\)である。母集団内の未治療者全員、ただし治療者のサンプルだけが選ばれた。このマッチしたペアからなる母集団の部分集合では、危機的状態(\(L = 1\))にある個体の割合は、設計上、治療された個体と未治療の個体で同じである(\(3/7\))。
マッチ母集団を構築するために、母集団中の被治療者を、マッチング因子\(L\)が未治療者と同じ分布を持つ被治療者の部分集合で置き換えた。\(L\)が与えられた条件付交換可能性の仮定の下では、この手順の結果は、マッチ集団における治療者と未治療者の(無条件の)交換可能性である。治療者と未治療者はマッチ集団で交換可能であるため、その平均結果は直接比較できる。治療者のリスクは\(3/7\)、未治療者のリスクは\(3/7\)であり、したがって因果リスク比は\(1\)である。治療者または未治療者しかいない層は分析から除外されるため、マッチングによってマッチ集団の正値性が保証されることに注意。
多くの場合、個体数の少ないグループ(この例では未治療群)を選び、もう一方のグループ(この例では治療群)を使ってマッチする個体数を見つける。選択されたグループは、因果効果を計算する部分集団を定義する。前の段落では、未治療群における効果を計算した。すべての層(\(L\))において、被治療者の方が未治療者よりも少ない設定では、一般的に被治療者の効果を計算する。また、マッチングは1対1(対のマッチング)である必要はなく、1対多(セットのマッチング)であってもよい。
多くのアプリケーションでは,\(L\)は複数の変数のベクトルである。そして、\(L\)中のすべての変数の値の組み合わせで定義される任意の層中の各未処置個体について、我々は同じ層から1つ(または複数)の処置個体(複数)を無作為に選んだことになる。
マッチングは、治療または未治療の分布だけでなく、\(L\) の任意の選択された分布を持つマッチ集団の作成に使用できる。対象となる分布は、上述のように個体マッチングによって達成することも、頻度マッチングによって達成することもできる。後者の例としては、治療された個体の70%が\(L = 1\)となるようにランダムに選択し、未治療の個体について同じ手順を繰り返す研究がある。マッチされた母集団は元の研究母集団の部分集合であるため、マッチされた研究母集団における因果効果修飾因子の分布は、次の節で議論するように、一般に元のマッチされていない研究母集団における分布とは異なる。
4.6 Effect modification and adjustment methods
標準化、IP重み付け、層別化・制限、およびマッチングは、平均的な因果効果を推定するための異なるアプローチであるが、それぞれ異なるタイプの因果効果を推定する。標準化とIP重み付けは、マージナル効果または条件付効果のいずれかを計算するために用いることができ、層別化・制限とマッチングは、母集団の特定の部分集合における条件付効果を計算するためにのみ用いることができる。4つのアプローチとも、交換可能性と正値性を必要とするが、これらの条件が成立する母集団の部分集合は、関心のある因果効果によって異なる。例えば、\(L = l\)の個体間の条件付効果を計算するためには、上記のどの手法も、その部分集合においてのみ交換性と正値性が必要である。
Technical Point 4.2 「層別効果測定のプーリング」
これまでのところ、我々は因果推論の概念的な側面、非統計的な側面に焦点を当ててきた。そのため、因果効果を(一貫して)推定するのではなく、因果効果を計算することについて話してきた。しかし、現実の世界では、母集団における因果効果を計算できることはほとんどない。したがって、推定された効果測定の信頼区間を適度に狭くすることは、重要な実用的関心事である。
層特異的効果測定を扱うとき、推定値のばらつきを減らすために一般的に用いられる戦略の1つは、すべての層特異的効果測定を1つのプールされた層特異的効果測定にまとめることである。この考え方は,効果測定がすべての層で同じであれば(すなわち、効果測定の修正がなければ)、プールされた効果測定は共通の効果測定のより正確な推定になるというものである。いくつかの手法(例えば,Woolf,Mantel-Haenszel、最尤法)はプール推定値を得るが、プール推定値の変動を減少させるために選択された重みで、層ごとの効果測定の重み付き平均を計算することもある。Greenland and Rothman (2008) は、層別分析によく使用されるいくつかの方法をレビューしている。プール効果測定は、すべての共変量\(L\)の間のすべての可能な積項を含むが,治療\(A\)と共変量\(L\)の間の積項は含まない回帰モデル,すなわち、\(L\)に関して飽和したモデル(第11章を参照)を用いて計算することもできる。
プーリングの主な目的は、共通の層特異的効果測定値の周りの信頼区間を狭くすることであるが、プールされた効果測定値は依然として条件付き効果測定値である。我々の心臓移植の例では、プールされた層特異的リスク比(Mantel-Haenszel法)は、結果\(Z\)について\(0.88\)であった。この結果は、層特異的リスク比\(2\)と\(0.5\)が本当に同じ層特異的因果効果の推定値である場合にのみ意味がある。例えば、因果リスク比が両方の層で\(0.9\)であるが、サンプルサイズが小さいので、\(0.5\)と\(2.0\)の推定値が得られたとする。この場合、プーリングが適切で、Mantel-Haenszelリスク比は層別リスク比のどちらよりも真実に近い。そうでなければ、層別リスク比が本当に\(0.5\)と\(2.0\)であれば、プーリングはほとんど意味をなさず、Mantel-Haenszelリスク比は容易に解釈できない。実際には、層間における効果測定の不均一性が、サンプリングのばらつきによるものなのか、効果測定の修正によるものなのかを判断するのは必ずしも明らかではない。層別を細かくすればするほど、ランダムな変動によってもたらされる不確実性が大きくなる。
効果修正がなければ、これら4つのアプローチで計算された効果測定値(リスク比またはリスク差)は等しくなる。例えば、表2.2の母集団全体(標準化とIP重み付け)、\(L = 1\)の重篤な状態と\(L = 0\)の非重篤な状態の母集団の部分集合(層別化)、および未治療の母集団(マッチング)のいずれにおいても、死亡率\(Y\)に対する心臓移植\(A\)の平均因果効果は無効であると結論した。しかし、これら4つのアプローチによって計算された効果測定は、一般的には等しくない。効果がどのように異なるかを説明するために、表4.3のデータを用いて、心臓移植\(A\)、高血圧\(Z\)(1:あり、それ以外は0)に対する効果を計算してみよう。交換可能性\(Z^a \mathop{\perp\!\!\!\!\perp} A|L\)と正値性が成立すると仮定する。特に理由はないが、リスク比尺度を使用する。
\(L\) | \(A\) | \(Z\) | |
Rheia | 0 | 0 | 0 |
Kronos | 0 | 0 | 1 |
Demeter | 0 | 0 | 0 |
Hades | 0 | 0 | 0 |
Hestia | 0 | 1 | 0 |
Poseidon | 0 | 1 | 0 |
Hera | 0 | 1 | 1 |
Zeus | 0 | 1 | 1 |
Artemis | 1 | 0 | 1 |
Apollo | 1 | 0 | 1 |
Leto | 1 | 0 | 0 |
Ares | 1 | 1 | 1 |
Athena | 1 | 1 | 1 |
Hephaestus | 1 | 1 | 1 |
Aphrodite | 1 | 1 | 0 |
Cyclope | 1 | 1 | 0 |
Persephone | 1 | 1 | 0 |
Hermes | 1 | 1 | 0 |
Hebe | 1 | 1 | 0 |
Dionysus | 1 | 1 | 0 |
Technical Point 4.3 「マージナルリスク比と条件付きリスク比の関係」
各層\(l\)の条件付きリスク比\(\text{Pr}[Y^{a=1} =1| L = l]/\text{Pr}[Y^{a=0} =1|L=l]\)の値がわかっていて、どの条件下でマージナルリスク比\(\text{Pr}[Y^{a=1} =1/\text{Pr}[Y^{a=0} =1]\)が\(1\)より小さくなるかを決定したいとする。そのためには、$$\text{Pr}[Y^{a = 1} = 1]/\text{Pr}[Y^{a = 0} = 1] = \sum_{l}{\{\text{Pr}[Y^{a = 1} = 1|L = l]/\text{Pr}[Y^{a = 0}=1 | L = l]\}\omega (l)}$$、ただし$$\omega (l) = \left\{\text{Pr}[Y^{a = 0} = 1 | L = l]\text{Pr}[L = l]\right\}/\text{Pr}[Y^{a = 0} = 1]$$に注意する。\(\omega (1)\)と\(\omega (0)\)を代入し、いくつかの代数的操作を行うと、不等式\(\text{Pr}[Y^{a=1} = 1]/\text{Pr}[Y^{a = 0} = 1] < 1\)が成り立つ条件が得られる。我々のデータ例では、\(\text{Pr}[Y^{a = 1} = 1| L = l]/\text{Pr}[Y^{a = 0} = 1| L = l]\)は、\(L = 1\)で\(0.5\)、\(L = 0\)で\(2.0\)である。したがって、\(\text{Pr}[Y^{a = 0} = 1| L = 1]/\text{Pr}[Y^{a = 0} = 1| L =0] > 2\text{Pr}[L=0]/\text{Pr}[L=1]\)の場合に限り、限界リスク比率は\(\)1より小さくなる。
標準化とIP重み付けは、母集団全体における平均因果効果\(\text{Pr}[Z^{a = 1} = 1]/\text{Pr}[Z^{a = 0} = 1] = 0.8\)をもたらす(これらと以下の計算は読者に任せる)。層別化により、層\(L=0\)では条件付き因果リスク比\(\text{Pr}[Z^{a=1} = 1|L = 0]/\text{Pr}[Z^{a=0} = 1|L = 0]=2.0\)、層\(L=1\)では\(\text{Pr}[Z^{a=1} =1|L =1]/\text{Pr}[Z^{a=0} =1|L =1]=0.5\)が得られる。前節で選択したマッチング・ペアを用いたマッチングでは、未治療での因果リスク比\(\text{Pr}[Z^{a=1} = 1|A = 0]/\text{Pr}[Z = 1|A = 0] = 1.0\)が得られる。
我々は4つの因果リスク比を計算し、4つの異なる数値を得た。\( 0.8、2.0、0.5、1.0\)である。これらはすべて正しい。ランダム変動(Technical Point 4.2参照)はさておき、この差の説明は定性的効果修飾である。 治療により、非重篤な状態にある人のリスクは\(2\)倍になり(\(L=0\)、因果リスク比\(2.0\))、重篤な状態にある人のリスクは半減する(\(L=1\)、因果リスク比\(0.5\))。母集団における平均的な因果効果(因果リスク比\(0.8\))は有益であるが、これは、マージナル群における無治療下の反事実リスクと非マージナル群におけるリスクの比\(\text{Pr}[Z^{a=0} = 1|L = 1] / \text{Pr}[Z^{a=0} = 1|L = 0]\)が、非臨界群におけるオッズ \(\text{Pr} [L = 0] / \text{Pr} [L = 1]\)の\(2\)倍を超えるためである(Technical Point 4.3参照)。未治療群における因果効果は無効であり(因果リスク比\(1.0\))、これは全集団と比較して未治療群では非臨界状態にある個体の割合が大きいことを反映している。この例は、効果測定が対応する母集団または母集団の部分集合を特定することの重要性を強調している。
前章では、因果関係が明確に定義されていることが、意味のある因果推論を行うための前提条件であると論じた。本章では、よく特徴づけられた対象集団もそのような前提条件であると主張する。両方の前提条件は、ある先験的な適格基準を満たす集団において2つ以上の介入を比較する実験において自動的に存在する。しかし、観察研究ではこれらの前提条件を当然と考えることはできない。むしろ、観察研究を実施する研究者は、関心のある因果効果と、その効果が計算される集団の部分集合を明確に定義する必要がある。そうでなければ、異なる方法で得られた効果測定値が異なる場合に誤解が生じやすくなる。
上記の例では、IP重み付けを用いた(そして全集団における効果を計算した)研究者と、マッチングを用いた(そして未治療者における効果を計算した)研究者が、一方の分析手法の優劣について議論する必要はない。両者の効果測定が食い違うのは、分析手法の選択というよりも、それぞれの研究者が問いかけた因果関係の質問の違いによるものである。実際、2人目の調査者は、IP重み付けを用いて、未治療群と被治療群の効果を計算することもできた(Technical Point 4.1参照)。
最後に注意。層別化は、母集団の部分集合における平均因果効果を計算するために使用できるが、個別(被験者固有)の因果効果を計算するためには使用できない。先に議論したように、個々の因果効果は極端な仮定のもとでのみ同定できる。Fine Point 2.1および3.2を参照。
\(V\) | \(A\) | \(Y\) | |
Rheia | 1 | 0 | 0 |
Demeter | 1 | 0 | 0 |
Hestia | 1 | 0 | 0 |
Hera | 1 | 0 | 0 |
Artemis | 1 | 0 | 1 |
Letp | 1 | 1 | 0 |
Athena | 1 | 1 | 1 |
Aphrodite | 1 | 1 | 1 |
Persephone | 1 | 1 | 0 |
Hebe | 1 | 1 | 1 |
Kronos | 0 | 0 | 0 |
Hades | 0 | 0 | 0 |
Poseidon | 0 | 0 | 1 |
Zeus | 0 | 0 | 1 |
Apollo | 0 | 0 | 0 |
Ares | 0 | 1 | 1 |
Hephaestus | 0 | 1 | 1 |
Cyclope | 0 | 1 | 1 |
Hermes | 0 | 1 | 0 |
Dionysus | 0 | 1 | 1 |
Fine Point 4.3 「崩壊性とオッズ比」
\(V\)による乗法的効果修飾がない場合、母集団全体における因果リスク比\(\text{Pr}[Y^{a=1} = 1]/ \text{Pr}[Y^{ a=0} = 1]\)は、\(V\)の各層\(v\)における条件付き因果リスク比\(\text{Pr}[Y^{a=1} = 1|V = v]/ \text{Pr}[Y^{a=0} = 1|V = v]\)に等しい。より一般的には、因果リスク比は層別リスク比の加重平均である。例えば、\(V = 1\)と\(V = 0\)の層における因果リスク比がそれぞれ\(2\)と\(3\)であったとすると、集団における因果リスク比は\(2\)より大きく\(3\)より小さくなる。母集団における因果リスク比(および因果リスク差)の値が、層別リスク比の値の範囲によって常に制約されることは、自明であるだけでなく、あらゆる効果測定の望ましい特徴でもある。
ここで、母集団効果測定が層別効果測定の加重平均ではない仮想的な効果測定(リスク比またはリスク差以外)を考える。つまり、母集団効果測定は、層別効果測定の値の範囲内にあるとは限らない。このような効果測定は奇妙なものである。「odds」比(ダジャレを意図している)は、ここで議論するように、そのような効果尺度である。
表4.4のデータが、ベースライン時にうつ病でなかった20人の集団におけるうつ病\(Y\)に対する標高\(A\)の因果効果を計算するために収集されたとする。治療\(A\)は、その個人が標高の高い住居(オリンポス山の頂上)に引っ越した場合は\(1\)、そうでない場合は\(0\)であり、結果\(Y\)は、その個人がその後うつ病を発症した場合は\(1\)、そうでない場合は\(0\)であり、\(V\)はその個人が女性の場合は\(1\)、男性の場合は\(0\)である。移動の決定はランダムであり、すなわち、うつ病を発症しやすい人は他の人と同じように移動する可能性があり、事実上\(Y^a\mathop{\perp\!\!\!\!\perp} A\)である。したがって、リスク比\(\text{Pr}[Y=1|A=1]/\text{Pr}[Y=1|A=0]=2.3\)が集団における因果リスク比であり、オッズ比は\(\displaystyle \frac{\text{Pr}[Y = 1|A = 1]/\text{Pr}[Y = 0|A = 1]}{\text{Pr}[Y=1|A=0]/\text{Pr}[Y=0|A=0]} = 5.4\)は母集団における因果オッズ比\(\displaystyle \frac{\text{Pr}[Y^{a=1} = 1]/\text{Pr}[Y^{a=1} = 0]}{\text{Pr}[Y^{a = 0} = 1]/\text{Pr}[Y^{a = 0} = 0]}\)である。リスク比とオッズ比は、異なるスケールで同じ因果効果を測定する。ここで、リスク比とオッズ比の尺度で性特異的因果効果を計算してみよう。(条件付き)因果リスク比\(\text{Pr}[Y =1|V =v, A=1]/\text{Pr}[Y =1|V = v, A=0]\)は、男性(\(V=0\))では\(2\)、女性(\(V=1\))では\(3\)である。(条件付き)因果オッズ比\(\displaystyle \frac{\text{Pr}[Y =1|V =v, A=1]/\text{Pr}[Y =0|V =v, A=1]}{\text{Pr}[Y =1|V =v, A=0]/\text{Pr}[Y =0|V =v, A=0]}\)は、男性(\(V=0\))で\(6\)、女性(\(V=1\))で\(6\)である。
母集団における因果リスク比\(2.3\)は、性特異的因果リスク比\(2\)と\(3\)の中間である。対照的に、母集団における因果オッズ比\(5.4\)は、両性特異的オッズ比\(6\)よりも小さい(すなわち、null値に近い)。オッズ比尺度で測定すると、因果効果は、母集団全体よりも母集団の各半数で大きい。\(V\)が\(Y\)の独立した危険因子で、我々のランダム化実験のように\(A\)が\(V\)から独立している場合、母集団の因果オッズ比は、非null層特異的因果オッズ比よりもnull値に近くなることがある (Miettinen and Cook, 1981)。
母集団の効果尺度が層別の効果尺度の加重平均として表現できる場合、効果尺度は折りたたみ可能であると言う。追跡研究では,リスク比とリスク差は折りたたみ可能な効果尺度であるが,オッズ比(まれに用いられるオッズ差)は折りたたみ可能ではない(Greenland 1987)。Jensenの不等式(Samuels 1981)の特殊なケースであるオッズ比の折りたたみ不可能性は、上記のような直感に反する知見につながる可能性がある。オッズ比は、鋭い帰無仮説の下では折りたたみ可能で、条件付き効果測定と無条件効果測定の両方が帰無値に等しくなり、追跡研究のすべての層で結果がまれ(たとえば,10%未満)な場合はほぼ折りたたみ可能で、リスク比とほぼ等しくなる。
オッズ比の非可換性の1つの重要な帰結は、「交換可能性の欠如 」と 「無条件オッズ比と比較した条件オッズ比の変化」を同一視することが論理的に不可能であることである。この例では、治療群と未治療群が交換可能であったにもかかわらず、オッズ比の変化は約10%(\(1 – 6/5.4\))であった。Greenland, Robins, and Pearl (1999)は、noncollapsibilityと交換可能性の欠如の関係をレビューしている。
コメント