[What if][Statistics]Causal Inference: What If

Table of Contents

Causal Inference: What if

こんな素晴らしい本が無料で読めるなんてさすがハーバード。

Miguel Hernan | Harvard T.H. Chan School of Public Health

Part I Causal inference without models

Chapter 1 A DEFINITION OF CAUSAL EFFECT

人間として、因果推論の基本的な概念にすでに生得的に精通している（ここらへんは因果推論の科学参照）。人類は生き抜く上で、因果関係とは何か、関連性と因果関係の違いを理解し、その知識を一貫して使ってきた。そうでなかったら、人類はすぐに死んでいただろう。基本的な因果関係の概念がなければ、この章を読めるようになるどころか、長く生き延びることもできなかっただろう。

因果関係の定義や、関連性と因果関係の違いはすでに理解しているので、この章から深い概念的洞察を得ようとは思わない方が良い。むしろこの章の目的は、人間がすでに持っている因果関係の直観を形式化する数学的表記法を紹介することである。自分の因果的直観と、ここで紹介する数学的表記法を一致させることができることを確認すること。この表記法は因果関係の概念を正確に定義するために必要であり、本書全体を通して使用される。

1.1 Individual causal effects

ゼウスは心臓移植を待つ患者である。1月1日に彼は新しい心臓を受け取る。その5日後、彼は死ぬ。もしゼウスが1月1日に心臓移植を受けなければ、5日後には生きていただろう。この情報があれば、移植がゼウスの死を引き起こしたことにほとんどの人が同意するだろう。心臓移植の介入はゼウスの5日後の生存に因果関係があったのだ。

別の患者ヘラも1月1日に心臓移植を受けた。その5日後、彼女は生きていた。もしヘラが1月1日に心臓移植を受けていなかったら、5日後も彼女は生きていただろう。したがって、移植はヘラの5日後の生存に因果関係はない。

この2つの例は、人間が因果関係についてどのように推論するかを示している。我々は、ある行動$A$がとられたときの結果と、その行動$A$が差し控えられたときの結果を（通常は精神的にだけ）比較する。もし2つの結果が異なれば、その行動$A$が結果に対して因果的効果（原因的効果または予防的効果）を持つと言う。そうでない場合は、行動$A$は結果に対して因果的効果がないと言う。疫学者、統計学者、経済学者、その他の社会科学者は、$A$を介入、曝露、または治療と呼ぶことが多い。

われわれの因果的直観を数学的・統計的分析に適合させるために、いくつかの表記法を導入する。二値の治療変数$A$（$1$：治療、$0$：未治療）と二値の結果変数$Y$（$1$：死亡、$0$：生存）を考える。本書では$A$や$Y$のような個体によって値が異なる可能性のある変数を確率変数と呼ぶ。$Y^{a=1}$を、治療値$a = 1$のもとで観察されたであろう結果変数とし、$Y^{a = 0}$を、治療値$a = 0$のもとで観察されたであろう結果変数とする。$Y^{a = 1}$および$Y^{a = 0}$も確率変数である。Zeusは$Y^{a = 1} = 1$であり、$Y^{a = 0} = 0$である。なぜなら彼は治療されると死亡するが、治療されなければ生存していたであろうからである。一方Hera は$Y^{a = 1} = 0$であり。$Y^{a = 0} = 0$である。なぜなら、彼女は治療されると生存し、治療されなくてもまた、生存していたであろうからである。

一般的に、大文字は確率変数を表し、下付き文字は確率変数の取る値のうち、特定のある値を示す。

ここで、個人に対する因果効果の正式な定義を提供することができる。$Y^{a = 1}\ne Y^{a = 0}$ならば、治療$A$は個人の結果$Y$に対して因果的効果を持つ。したがって、$Y^{a = 1} = 1, Y^{a = 0} = 0$なので、治療はゼウスの結果に対して因果的効果を持つが、$Y^{a = 1} = Y^{a = 0} = 0$なので、ヘラの結果に対しては因果的効果を持たない。変数$Y^{a = 1}$と$Y^{a = 0}$は、潜在的結果または反事実的結果と呼ばれる。受けた治療によってこれら2つの結果のどちらかが観察される可能性があることを強調するために、「潜在的な結果」という用語を好む者もいる。他の著者は、これらの結果が実際には起こらないかもしれない状況（つまり、反事実的状況）を表していることを強調するために、「反事実的結果」という用語を好む。

各個人について、反事実的結果の1つ、つまりその個体が受けた治療値に相関するもの、は実際に事実である。例えば、Zeusは実際に治療を受けた$(A = 1)$ので、彼の治療下での反事実的結果$Y^{a = 1} = 1$は、彼の観察された（実際の）結果$Y = 1$に等しい。すなわち、観察された治療$A$が$a$に等しい個人は、観察された結果$Y$が彼の反事実的結果$Y^ { a}$に等しい。この等式は、$Y = Y^{A}$と簡潔に表現できる。ここで$Y^{A}$ は、個人の観察された治療$A$に対応する値$Y^a$で評価される反事実$Y^a$を表す。$Y = Y^A$という等式は一貫性と呼ばれる。

個人の因果効果は、反実仮想的な結果の値の対比として定義されるが、各個人について観察されるのはそのうちの1つだけである。他のすべての反事実的結果は観察されないままである。欠損データのために、個人効果は同定できない。つまり、観察されたデータの関数として表現できない。

「実際に受けた治療の結果がその治療下の反事実と同じ」というのは一見当然のように思える。しかし、consistency（整合性）は因果推論の理論を数学的に成立させる上できわめて重要な前提であり、決して単なる自明な確認ではない。以下にその理由を整理する。

1. 「反事実」モデルを現実データとつなぐ唯一の橋

因果推論では、「もし治療を受けなかったら」という反事実的な結果$Y^{(0)}$を直接観察できない。データで観察できるのは$A$（治療）と$Y$（実際の結果）だけである。整合性仮定$ Y = Y^{(A)}$ によって観察された結果$Y$を、反事実変数 Y^{(A)} と結びつけて扱うことができる。このリンクがないと、反事実モデルは理論上の存在にとどまり、データから因果効果を推定できない。

2. 治療の定義が曖昧なときには破れる

整合性が破れる典型例は、「同じ治療$A=1$」と言っても内容が異なる場合である。
例えば：
• 「ワクチンを接種した」という治療が、メーカーや接種量によって異なる
• 「教育プログラムに参加した」が、講師や期間が個人で違う

このような場合、「$A=1$」というラベルのもとに異なる介入が混在し、「実際に受けた治療のもとでの$Y^{(A)}$」が一意に定まらず、結果として$Y \neq Y^{(A)}$となり得る。このとき、因果効果の推定は無意味になる。

3. 他の仮定（交換可能性や重複性）を成立させるための前提

因果推論の三大仮定は
1. Consistency（整合性）
2. Exchangeability（交差可能性／無交絡）
3. Positivity（重複性）
である。整合性がなければ、たとえ無交絡を仮定しても、「比較しているものが同じ介入のもとでの反事実」である保証が失われる。

1.2 Average causal effects

個々の因果効果を定義するためには、3つの情報が必要である。関心のある結果、比較される行動$a = 1$と$a = 0$、そしてその反事実の結果$Y^{a = 0} $と$Y^{a = 1}$が比較される個人である。しかし、個々の因果効果を同定することは一般に不可能であるため、ここでは、集約された因果効果、すなわち個人の集団における平均的な因果効果に注目する。この因果効果を定義するためには、3つの情報が必要である。つまり関心のある結果、比較される行動$a = 1$と$a = 0$、そして、結果$Y^{a = 0}$と$Y^{a = 1}$が比較される個人のよく定義された集団である。

ゼウスの拡大家族を対象集団とする。表1.1は、集団の20人全員について、治療$(a = 1)$と無治療$(a = 0)$の両方の場合の反事実結果を示している。最後の列に注目しよう。各個人が治療（心臓移植）を受けていた場合に観察されたであろう結果$Y^{a = 1}$である。もし心臓移植を受けていれば、集団の半数（20人中10人）が死亡したであろう。すなわち、全集団個体が$a = 1$を受けたとしたら、その結果を発症した個体の割合は、$\text{Pr}[Y^{a = 1} = 1] = 10/20 = 0.5$である。同様に、表1.1のもう1つの列から、もし心臓移植を受けなければ、集団の半数（20人中10人）が死亡していたと結論づけることができる。すなわち、すべての集団が$a = 0$を受けたとしたら、その結果を発症したであろう個人の割合は、$\text{Pr}[Y^{a = 0} = 1] = 10/20 = 0.5$である。死亡者数（10人）を数え、それを個体総数（20人）で割ることによって、治療下の反実仮想リスクを$0.5$と計算している。二値の結果に対するリスクと平均の等価性を見るために、表1.1のデータを使って$Y^{a = 1}$の平均を計算する。

	$Y^{a = 0}$	$Y^{a = 1}$
Pheia	0	1
Kronos	1	0
Demeter	0	0
Hades	0	0
Hestia	0	0
Poseidon	1	0
Hera	0	0
Zeus	0	1
Artemis	1	1
Apollo	1	0
Leto	0	1
Ares	1	1
Athena	1	1
Hephaestus	0	1
Aphrodite	0	1
Cydope	0	1
Persephone	1	1
Hermes	1	0
Hebe	1	0
Dionysus	1	0

表1.1

Fine Point 1.1「干渉とはなにか？」反実仮想的結果の定義は、治療$a$のもとでの個人の反実仮想的結果が、他の個人の治療価値に依存しないことを暗黙のうちに仮定している。例えば、ヘラが心臓移植を受けるかどうかに関係なく、ゼウスが心臓移植を受ければゼウスは死ぬと暗黙のうちに仮定した。つまり、ヘラの治療価値はゼウスの結果に干渉しない。一方、ヘラが新しい心臓を手に入れたことで、ゼウスが動揺し、ヘラが心臓移植を受けなければ助かったにもかかわらず、自分の心臓移植では助からなかったとする。このシナリオでは、ヘラの治療がゼウスの結果を妨害している。個体間の干渉は、伝染性病原体や教育プログラムを扱う研究ではよくあることで、個体の結果は他の集団メンバーとの社会的相互作用に影響される。
干渉が存在する場合、個人の結果が他の個人の治療値に依存するため、個人$i$の反事実$Y^{a}_i$はうまく定義されない。干渉がある場合、「ゼウスの結果に対する心臓移植の因果効果」はうまく定義されない。むしろ、”ヘラが新しい心臓を得なかったときのゼウスの結果に対する心臓移植の因果効果”、または “ヘラが新しい心臓を得たときのゼウスの結果に対する心臓移植の因果効果 “を参照する必要がある。他の親族や友人の治療もゼウスの転帰に干渉する場合、ゼウスの転帰に対する治療の因果効果は、心臓の特定の割り当てごとに異なる可能性があるため、「親族や友人が新しい心臓を得なかった場合」、「ヘラだけが新しい心臓を得た場合」など、ゼウスの転帰に対する心臓移植の因果効果を参照する必要があるかもしれない。干渉がないという仮定は，Cox (1958)によって “ユニット間の交互作用なし “とラベル付けされ，Rubin (1980)によって記述された “安定ユニット-治療値の仮定（SUTVA）”に含まれる．因果効果の定義における干渉の役割については、Halloran and Struchiner (1995), Sobel (2006), Rosenbaum (2007), Hudgens and Halloran (2009)を参照。特に断りのない限り、本書では干渉がないと仮定する。

我々は今、母集団における平均因果効果の正式な定義を提供する準備ができている。アウトカム$Y$に対する治療$A$の平均因果効果は、対象集団における$\text{Pr}[Y^{a = 1} = 1]\ne \text{Pr}[Y^{a = 0} = 1]$の場合に存在する。この定義のもとでは、治療下での死亡リスク$\text{Pr}[Y^{a = 1} = 1]$と無治療下での死亡リスク$\text{Pr}[Y^{a = 0} = 1]$の両方が$0.5$であるため、治療$A$は、集団における結果$Y$に対して平均因果効果を持たない。すべての人が心臓移植を受けるか受けないかは問題ではない。どちらの場合でも半数は死亡する。ここでのように、母集団における平均因果効果がnullであるとき、平均因果効果がないという帰無仮説が真であると言う。リスクは平均に等しく、$\text{E}$という文字は通常、集団の平均または平均（「Expectation」とも呼ばれる）を表すために用いられるので、集団における非null平均因果効果の定義を$\text{E}[Y^{a = 1}]\ne \text{E}[Y^{a = 0}]$と書き直すことができ、この定義は二値と非二値の両方の結果に適用される。

心臓移植の平均的因果効果$A$の存在は、”心臓移植を受ける$(a = 1)$”と “心臓移植を受けない$(a = 0)$”という2つの行動を含む対比によって定義される。2つ以上の行為が可能な場合（すなわち、処置が二値でない場合）、関心のある特定の対比を指定する必要がある。例えば、”アスピリンの因果効果 “は、”アスピリンを毎日150mg（必要であれば経鼻胃管も）、5年間、生きている間に摂取した “場合と “摂取しなかった “場合の対比を明示しなければ意味がない。この因果効果は、他の介入による反事実の結果がよく定義されていなかったり、存在しなかったりしても、よく定義されている（例えば、「生きている間に、毎日500mgのアスピリンを皮膚から吸収させて5年間服用する」）。

Fine Point 1.2「複数の治療バージョン」。治療値$a$の下での反事実的結果の定義もまた、治療値$A = a$が1つのバージョンしか存在しないことを暗黙のうちに仮定している。例えば、我々はZeusが心臓移植を受けたら死ぬと言った。この文は、すべての心臓移植が同じ外科医によって同じ手技と設備で行われることを暗黙のうちに仮定している。つまり、”心臓移植 “という治療のバージョンは1つしかない。もし、複数の治療法（例えば、異なる技術を持つ外科医）があれば、ゼウスがアスクレピオスによって心臓移植を受ければ生き残り、ヒギイアによって心臓移植を受ければ死んでしまう可能性がある。治療の複数のバージョンが存在する場合、個人の結果は治療のバージョン$a$に依存するため、個人$i$の反事実$Y^{a}_i$はうまく定義されない。治療のバージョンが複数ある場合、「ゼウスの結果に対する心臓移植の因果効果」はうまく定義されない。むしろ、”アスクレピオスが手術を行うときのゼウスの結果に対する心臓移植の因果的効果 “または “ヒギイアが手術を行うときのゼウスの結果に対する心臓移植の因果的効果 “を参照する必要がある。治療の他の構成要素（例えば、手順、場所）も結果に関連している場合、治療の特定のバージョンごとにゼウスの結果に対する治療の因果効果が異なる可能性があるため、「アスクレピオスがコス神殿で杖を使って手術を行うとき、ゼウスの結果に対する心臓移植の因果効果」を参照する必要があるかもしれない。
干渉がないという仮定と同様に、治療の複数のバージョンがないという仮定は、Rubin (1980)によって記述された「安定単位-治療値の仮定（SUTVA）」に含まれる。RobinsとGreenland (2000)は、もし特定の治療（例えば心臓移植）のバージョンが結果（生存）に対して同じ因果効果を持つならば、反事実$Y^{a = 1}$はよく定義されるだろうという指摘をした。VanderWeele (2009)は、この点を「治療変動無関係性」の仮定、すなわち、治療の複数のバージョン$A = a$が存在しても、それらはすべて同じ結果${Y^{a}}_{i}$をもたらすという仮定として定式化した。この問題については第3章で触れるが、特に断りのない限り、本書では治療のばらつきの無関連性を仮定する。

平均因果効果の不在は、個別効果の不在を意味しない。表1.1は、治療が集団の12人のメンバー（ゼウスを含む）に個別因果効果を持つことを示している。なぜなら、これらの12人の各個人について、彼らの反事実結果の値$Y^{a = 1}$と$Y^{a = 0}$が異なるからである。この12人のうち、ゼウスを含む6人は治療によって害を受け$(Y^{a = 1}-Y^{a = 0} = 1)$、6人は助けられた$(Y^{a = 1} – Y^{a = 0} = -1)$。この等式は偶然ではない。平均因果効果$\text{E}[Y^{a = 1}] -\text{E}[Y^{a = 0}]$は、個々の因果効果$Y^{a = 1}-Y^{a = 0}$の平均$\text{E}[Y^{a = 1}-Y^{a = 0}]$と常に等しく、平均の差は差の平均に等しいからである。母集団のどの個体にも因果効果がないとき、すなわち、すべての個体について$Y^{a = 1} = Y^{a = 0}$であるとき、シャープ因果帰無仮説が真であると言う。シャープ因果帰無仮説は、平均効果がないという帰無仮説を意味する。

次章で議論するように、個々の因果効果は識別できなくても、平均因果効果はデータから識別できることがある。以下では、「平均的因果効果」を単に「因果効果」と呼び、平均的効果がないという帰無仮説を因果帰無仮説と呼ぶ。次に、因果効果の大きさのさまざまな尺度について説明する。

Technical Point 1.1「集団における因果効果：$\text{E}[Y^a]$を、集団のすべての個体が治療レベル$a$を受けていた場合の平均反事実結果とする。離散的な結果の場合，平均または期待値$\text{E}[Y^a]$は、確率変数$Y^a$のすべての可能な値$y$にわたる重み付き合計$\displaystyle \sum_{y}{y\ pY^a(y)}$として定義される。ここで、$p\ Y^a(\cdot)$は$Y^a$の確率質量関数であり、すなわち$pY^a(y) = \text{Pr}[Y^a = y]$である。binaryのアウトカムについては、$\text{E}[Y^{a}] = \text{Pr}[Y^a = 1]$である。連続的な結果の場合、期待値$\text{E}[Y^a]$は、確率変数$Y^a$のすべての可能な値$y$上の積分$\displaystyle \int{yf_{Y^a}(y)dy}$として定義され、$\displaystyle f_{Y^a}(\cdot)$は$Y^a$の確率密度関数である。離散結果と連続結果の両方に適用される期待値の一般的な表現は、$\displaystyle \text{E}[Y^a] = \int{ydF_{Y^a(y)}}$であり、ここで$F_{Y^a}$は確率変数$Y^a$の累積分布関数(cdf)である。$\text{E}[Y^a]\ne \text{E}[Y^{a^{\prime}}]$が任意の2つの値$a, a^{\prime}$について成り立つ場合、母集団に非null平均因果効果があると言う。
平均因果効果は、反事実的結果の平均の対比によって定義され、最も一般的に使用される母集団因果効果である。しかし、母集団因果効果は、反実仮想結果の中央値、分散、ハザード、cdfなどの関数の対比として定義することもできる。一般に、母集団因果効果は、異なる行動または処置値のもとでの反事実的結果の周辺分布の任意の関数の対比として定義することができる。例えば、分散に対する集団因果効果は、$var(Y^{a = 1})-var(Y^{a = 0})$と定義される。$Y^{a = 1}$と$Y^{a = 0}$の分布は同じで、どちらも20人中6人が死亡しているので、表1.1の集団ではゼロである。実際、これらの分布が等しいということは、どのような汎関数（例えば，平均，分散，中央値，ハザードなど）についても，汎関数に対する母集団の因果効果はゼロであることを意味する。しかし、平均とは対照的に、母集団の分散の差$var(Y^{a = 1})-var(Y^{a = 0})$は、一般に個々の因果効果の分散$var(Y^{a = 1}-Y^{a = 0})$と等しくない。例えば、表1.1では、$Y^{a = 1}-Y^{a = 0}$は一定ではないので（6人の場合は-1、6人の場合は1、8人の場合は0）、$var(Y^{a = 1}-Y^{a = 0}) > 0, var(Y^{a = 1})-var(Y^{a =0}) = 0$となる。無作為化試験で収集されたデータから、$var(Y^{a = 1})-var(Y^{a = 0})$を同定（すなわち計算）することはできるが、$var(Y^{a = 1}-Y^{a = 0})$を同定することはできない。なぜなら、どの個人についても、$Y^{a = 1}$と$Y^{a = 0}$の両方を同時に観測することはできないので、$Y^{a = 1}$と$Y^{a = 0}$の共分散は同定されないからである。上記の議論は、分散だけでなく任意の非線形関数（たとえば中央値やハザード）についても当てはまる。

1.3 Measures of causal effect

我々は、Zeusの家族20人の母集団において、心臓移植治療$A$が死亡という結果$Y$に因果的効果を持たないことを見た。2つの反事実リスク$\text{Pr}[Y^{a = 1} = 1]$と$\text{Pr}[Y^{a = 0} = 1]$が$0$に等しいので、因果帰無仮説が成り立つ。因果帰無仮説を表現する等価な方法は以下のようになる。たとえばリスク$\text{Pr}[Y^{a = 1} = 1]$からリスク$\text{Pr}[Y^{a = 0} = 1]$を引いたものがゼロ$(0.5-0.5 = 0)$であるとか、リスク$\text{Pr}[Y^{a = 1} = 1]$をリスク$\text{Pr}[Y^{a = 0} = 1]$で割ったものが$1$$(0.5/0.5 = 1)$であると言うことができる。$$\begin{eqnarray}(i) & & \text{Pr}[Y^{a = 1} = 1]-\text{Pr}[Y^{a = 0} = 1] = 0\\ (ii) & & \frac{\text{Pr}[Y^{a = 1} = 1]}{\text{Pr}[Y^{a = 0} = 1]} = 1\\ (iii) & & \frac{\text{Pr}[Y^{a = 1}]/\text{Pr}[Y^{a = 1} = 0]}{\text{Pr}[Y^{a = 0} = 1]/\text{Pr}[Y^{a = 0} = 0]} = 1 \end{eqnarray}$$ここで、等号(i)、(ii)、(iii)の左辺は、それぞれ因果リスク差、リスク比、オッズ比である。

今、我々の集団において、もう1つの治療法$A$であるタバコの喫煙が、もう1つの結果$Y$ 、肺がんに因果的効果を持つとする。因果帰無仮説は成り立たない。なぜなら$\text{Pr}[Y^{a = 1} = 1]$と$\text{Pr}[Y^{a = 0} = 1]$は等しくない。この設定では因果リスク差、リスク比、オッズ比は0, 1, 1ではない。むしろ、これらの因果パラメータは、同じ因果効果の強さを異なる尺度で定量化したものである。因果リスク差、リスク比、オッズ比（およびその他の要約）は、因果効果を測定するので、効果測定と呼ぶ。

それぞれの効果測定は、異なる目的で使用されることがある。例えば、100万人に3人が治療を受ければ転帰を発症し、100万人に1人が治療を受けなければ転帰を発症するような大規模集団を想像してみよう。因果リスク比は$3$、因果リスク差は$0.000002$である。因果リスク比(乗法的尺度)は、無治療と比較して治療が疾病リスクを何倍増加させるかを計算するために用いられる。因果リスク差（加法的尺度）は、治療に起因する疾患の絶対症例数を計算するために使用される。乗法的尺度と加法的尺度のどちらを用いるかは、推論の目的によって異なるだろう。

Fine Point 1.3「治療に必要な数」

1億人の患者のうち、治療を受ければ$(a = 1)$2,000万人が5年以内に死亡し、治療を受けなければ$(a = 0)$3,000万人が5年以内に死亡するとする。この情報は、いくつかの等価な方法で要約することができる。
・因果リスク差は$\text{Pr}[Y^{a = 1} = 1]-\text{Pr}[Y^{a = 0} = 1] = 0.2-0.3 = -0.1$である。
・1億人の患者を治療すれば、その1億人の患者を治療しない場合よりも、死亡者数は1000万人少なくなる。
・1000万人の命を救うには、1億人の患者を治療する必要がある。
・平均して、1人の命を救うために10人の患者を治療する必要がある。
$Y = 1$の症例数を$1$減らすために、$a = 1$の治療を受ける必要がある平均人数を、治療必要数（NNT）と呼ぶ。この例では、NNTは10に等しい。平均症例数を減少させる治療（すなわち、因果的リスク差が負）の場合、NNTは因果的リスク差の絶対値の逆数に等しい。$$NTT = \frac{-1}{\text{Pr}[Y^{a = 1} = 1]-\text{Pr}[Y^{a = 0} = 1]}$$平均症例数を増加させる(すなわち、因果的リスク差が正である)治療については、害に必要な数を対称的に定義することができる。NNTはLaupacis, Sackett, and Roberts (1988)によって導入された。因果リスク差と同様に、NNTはその根拠となる集団と時間間隔に適用される。効果指標としてのNNTの相対的な利点と欠点については、Grieve (2003)を参照。

1.4 Random variability

この時点で、効果測定の計算手順がいささか非現実的だと文句を言われるかもしれない。不死身のゼウスは死ぬことができないというよく知られた事実を無視しただけでなく、もっと重要なことは、表1.1の母集団は20個体しかなかったということである。興味のある母集団は通常もっと大きい。

私たちの小さな集団では、すべての個体から情報を収集した。実際には、調査者は対象集団のサンプルについての情報しか収集しない。すべての調査対象個体の反事実転帰がわかっていたとしても、標本で作業することにより、治療値$a$の下で転帰を得た個体の正確な比率を得ることができなくなる。例えば、無治療での死亡確率$\text{Pr}[Y^{a = 0} = 1]$を直接計算することはできず、推定することしかできない。

Table 1.1の個人を考えてみる。これまで彼らを20人の集団とみなしてきたが、仮にもっと大規模で無限に近い無作為標本とみなすことにする。治療していなければ死亡したであろうサンプル中の個人の割合は$\widehat{\text{Pr}}[Y^{a = 0} = 1] = 10/20 = 0.5$である。サンプル中の比率$\widehat{\text{Pr}}[Y^{a = 0} = 1]$は、この仮想的超集団が全員無治療であった場合に死亡したであろう個体の割合$\text{Pr}[Y^{a = 0} = 1]$と正確に等しくなる必要はない。例えば、母集団では$\text{Pr}[Y^{a = 0} = 1 ]= 0.57$だが、サンプリングのばらつきによるランダム誤差のため、我々の特定のサンプルでは$\widehat{\text{Pr}}[Y^{a = 0} = 1] = 0.5$だったとする。処理値$a$の下での超母集団確率$Pr[Y^{a} = 1]$を推定するために、標本割合$\widehat{\text{Pr}}[Y^{a = 0} = 1]=0.5$を用いる。$\text{Pr}$の上のハットは、標本割合$\widehat{\text{Pr}}[Y^{a = 0} = 1]$が対応する母集団量$\text{Pr}[Y^a = 1]$の推定量であることを示す。標本の個体数が多ければ多いほど、$\widehat{\text{Pr}}[Y^{a = 0} = 1]$と${\text{Pr}}[Y^{a = 0} = 1]$の差は小さくなると予想されるので、$\widehat{\text{Pr}}[Y^{a = 0} = 1]$は${\text{Pr}}[Y^{a = 0} = 1]$の一貫した推定量であると言う。これは、サンプリングのばらつきによる誤差がランダムであるため、大数の法則に従うからである。

超母集団確率$\text{Pr}[Y^a = 1]$は計算できず、標本割合$\widehat{\text{Pr}}[Y^a = 1]$によって一貫して推定されるだけなので、因果効果がある、またはないと確実に結論づけることはできない。むしろ、因果帰無仮説$\text{Pr}[Y^{a=1} = 1] = \text{Pr}[Y^{a=0} = 1]$に関する経験的証拠を評価するために統計的手順を使用しなければならない（詳細は第10章参照）。

これまでのところ、ランダム・エラーの原因としてサンプリングのばらつきだけを考えてきた。しかし、ランダムな変動の原因はもう1つあるかもしれない。おそらく、個人の反実仮想結果の値は、事前に固定されていないのであろう。我々は、反事実的結果$Y^a$を、治療値$a$を受けた場合の個人の結果と定義した。例えば、最初のビネットでは、Zeusは治療を受ければ死亡し、治療を受けなければ生存していた。定義されたように、反実仮想結果の値は、各個人について固定または決定論的である。例えば、Zeusの場合、$Y^{a = 1} = 1$かつ$Y^{a=0} = 0$である。言い換えれば、ゼウスは治療を受ければ100％の確率で死に、治療を受けなければ0％の確率で死ぬ。しかし、ゼウスが治療されれば90％の確率で死に、治療されなければ10％の確率で死ぬという別のシナリオを想像することもできる。このシナリオでは、ゼウスが治療を受けた場合$(0.9)$と治療を受けなかった場合$(0.1)$に死亡する確率は0でも1でもないため、反事実的な結果は確率論的または非決定論的である。表1.1に示した$Y^{a = 1}$と$Y^{a = 0}$は、これらの確率で「死亡率コインのランダムな反転」を実現する可能性のある値である。さらに、すべての人が同じようにその結果を受けやすいわけではないので、これらの確率は個人によって異なることが予想される。量子力学は古典力学とは対照的に、結果は本質的に非決定的であるとする。つまり、量子力学的にゼウスが死ぬ確率が90％である場合、ゼウスに関するデータをいくら集めても、治療した場合にゼウスが実際にその結果になるかどうかの不確実性は減じられないという理論である。

このように、因果推論におけるランダム誤差は、サンプリングのばらつき、非決定論的な反事実、あるいはその両方から生じる。しかし、教育上の理由から、第10章までランダム誤差をほとんど無視し続ける。具体的には、反事実的な結果は決定論的であり、非常に大きな（おそらく仮説上の）超集団のすべての個体に関するデータを記録していると仮定する。これは、われわれの20人の個体群を、10億人がゼウスと同一であり、10億人がヘラと同一であるような、200億人の個体群とみなすことに等しい。したがって、第10章までは、オリンポスのような確実性をもって計算を行うことにする。

そして第10章では、超人口における因果効果の統計的推定値と信頼区間が、個体レベルで世界が確率的（量子的）であるか決定論的（類型的）であるかにかかわらず、同一であることを説明する。対照的に、実際の調査標本における平均的な因果効果の信頼区間は、個体レベルの世界が決定論的か確率論的かによって異なる。幸いなことに、ほとんどの場合、超集団効果は実質的に関心のある因果効果である。

Technical Point 1.2 「非決定論的な反事実」
非決定論的反実仮想の場合、治療値$a$の下での平均結果$E[Y^a]$は、確率変数$Y^a$のすべての可能な値$y$に対する加重和$\displaystyle \sum_y{y p_{Y^a}(y)}$に等しい、ここで、確率質量関数$p_{Y^a}( \cdot)=\mathrm{E}\left[Q_{Y^a}(\cdot)\right]$, $Q_{Y^a}(y)$は治療水準$a$で結果$Y=y$となる確率である。本文の例では、ゼウスは$Q_{Y^{a=1}}(1)=0.9$である。(連続的な結果の場合、加重和は積分に置き換えられる）。より一般的には、反事実的結果の非決定論的定義は、各個人に確率変数$Y^a$の特定の値を付けるのではなく、$Y^a$の個人固有の統計分布$\Theta_{Y^a}(\cdot)$を付ける。因果効果の非決定論的定義は、決定論的定義の一般化であり、$\Theta_{Y^a}(\cdot)$は0と1の間の値を取りうるランダムなCDFである。母集団 $\mathrm{E} \left[Y^a \right]$ における平均的な反事実結果は $\mathrm{E} \left[Y^a \mid \Theta_{Y^a}( \cdot)\right]$ に等しい。よって、$\mathrm{E}\left[Y^a\right]=\mathrm{E}\left[\int y d \Theta_{Y^a}(y) \right]=\int y d F_{Y^a}(y)$となる。ここで、$F_{Y^a}(\cdot)=E\left[\Theta_{Y_i^a}(\cdot)\right]$である。反事実結果が二値で非決定論的な場合、母集団における因果リスク比$\displaystyle \frac{E[Q_{Y^{a = 1}}(1)]}{E[Q_{Y^{a = 0}}(1)]}$は、個々の因果効果$Q_{Y^{a = 1}}(1)/Q_{Y^{a = 0}}(1)$の比率尺度での加重平均$\mathrm{E}[W\{Q_{Y^{a = 1}}(1)/Q_{Y^{a = 0}}(1)\}]$に等しい。ただし、重み $W = \frac{Q_{Y^{a = 0}}(1)}{E[Q_{Y^{a = 0}}(1)]}$としたとき、$Q_{Y^a=0}(1)$が$0$になることはない（すなわち、決定論的)。

1.5 Causation versus association

もちろん、実際の研究から得られるデータは、表1.1のものとは異なる。例えば、治療した$Y^{a = 1}$の場合のZeusの結果と、治療していない$Y^{a = 0}$の場合のZeusの結果を知ることは、通常期待しない。観察された結果を$Y$と呼ぶ。したがって、各個人について、表1.2のように、観察された治療レベル$A$と結果$Y$を知ることができる。

表1.2のデータを用いて、たまたま治療値$a$を受けた集団の中で、結果$Y$を発症した個人の割合を計算することができる。例えば、表1.2では、治療を受けた13人$(A = 1)$のうち、7人が死亡した$(Y = 1)$。したがって、治療を受けた者の死亡リスク$\text{Pr}[Y = 1 | A = 1]$は$7/13$である。より一般的には、条件付き確率$\text{Pr}[Y = 1 | A = a]$は、対象集団の中でたまたま治療値$a$を受けた個体の中で、結果$Y$を発症した個体の割合として定義される。

治療された$\text{Pr}[Y = 1 | A = 1]$でアウトカムを発症する個人の割合が、治療されていない$\text{Pr}[Y = 1 | A = 0]$でアウトカムを発症する個人の割合と等しいとき、治療$A$とアウトカム$Y$は独立である、$A$は$Y$と関連しない、または$A$は$Y$を予測しない、と言う。独立性は、$Y \mathop{\perp\!\!\!\!\perp}A$または、等価的に、$A\mathop{\perp\!\!\!\!\perp}Y$で表され、これは、$Y$と$A$は独立していると読める。独立性の等価な定義は以下の通りである。$$\begin{eqnarray}(i) & & \text{Pr}[Y = 1| A = 1]-\text{Pr}[Y = 1 | A = 0] = 0\\ (ii) & & \frac{\text{Pr}[Y = 1| A = 1]}{\text{Pr}[Y = 1| A = 0]} = 1\\ (iii) & & \frac{\text{Pr}[Y = 1| A = 1]/\text{Pr}[Y = 0| A = 1]}{\text{Pr}[Y = 1| A = 0]/\text{Pr}[Y = 0| A = 0]} = 1\end{eqnarray}$$ここで、不等式(i)、(ii)、(iii)の左辺はそれぞれ、関連リスク差、リスク比、オッズ比である。

	$A$	$Y$
Rheia	0	0
Kronos	0	0
Demeter	0	0
Hades	0	0
Hestia	1	0
Poseidon	1	0
Hera	1	0
Zeus	1	1
Artemis	0	1
Apollo	0	1
Leto	0	0
Ares	1	1
Athena	1	1
Hephaestus	1	1
Aphrodite	1	1
Cyclope	1	1
Persephone	1	1
Hermes	1	0
Hebe	1	0
Dionysus	1	0

Table 1.2

$\text{Pr}[Y = 1| A = 1]\ne \text{Pr}[Y = 1| A = 0]$のとき、治療$A$と結果$Y$は従属的である、または関連していると言う。我々の集団では、$\text{Pr}[Y = 1| A = 1] = 7/13$であり、$\text{Pr}[Y = 1| A = 0] = 3/7$なので、治療と結果は確かに関連している。関連リスク差、リスク比、オッズ比（およびその他の尺度）は、関連が存在する場合にその強さを定量化する。これらは異なる尺度で関連を測定しており、我々はこれらを関連尺度と呼んでいる。これらの尺度もランダムな変動の影響を受ける。しかし第10章までは、表1.2の母集団が極めて大きいと仮定して統計的問題を無視する。

二項結果の場合、リスクは母集団の平均に等しいので、母集団における関連性の定義を$E[Y|A = 1]\ne E[Y|A = 0]$と書き換えることができる。連続的な結果$Y$についても、$E[Y|A = 1]\ne E[Y|A = 0]$として関連を定義する。二値変数$A$の場合、$A, Y$は、統計的に相関がない場合に限り、関連しない。

20人の集団では、(i)20人全員が治療を受けた場合の死亡リスクと、20人全員が治療を受けなかった場合の死亡リスクを比較した結果、因果関係は認められなかったが、(ii)たまたま治療を受けた13人の死亡リスクと、たまたま治療を受けなかった7人の死亡リスクを比較した結果、関連が認められた。図1.1に因果関係と関連性の違いを示す。図1.1は、母集団（菱形で表現）を白い領域（治療者）と小さい灰色の領域（未治療者）に分けている。

因果関係の定義は、白い菱形全体（治療を受けたすべての個体）と灰色の菱形全体（治療を受けなかったすべての個体）の対比を意味するのに対し、関連性は、元の菱形の白い部分（治療を受けた個体）と灰色の部分（治療を受けなかった個体）の対比を意味する。つまり、因果関係についての推論は、”全員が治療を受けていたらリスクはどうなるか”、”全員が未治療だったらリスクはどうなるか “といった、対幻想世界における “もしも “の問いに関係するのに対し、関連性についての推論は、”治療を受けている人のリスクはどうなるか”、”未治療の人のリスクはどうなるか “といった、現実世界における問いに関係する。我々は、因果関係と関連性の間のこの区別を形式化するために、これまでに開発した表記法を使用することができる。リスク$\text{Pr}[Y = 1|A = a]$は条件付き確率であり、「実際に治療値$a^{\prime}$を受けた」（すなわち、$A = a$）という条件を満たす集団の部分集合における$Y$ のリスクである。対照的に、リスク$\text{Pr}[Y^a = 1]$は、無条件確率（周辺確率としても知られる）であり、母集団全体における$Y^a$のリスクである。したがって、関連性は、個人の実際の治療値（$A= 1$または$A = 0$）によって決定される母集団の2つの不連続な部分集合における異なるリスクによって定義され、一方、因果関係は、2つの異なる治療値（$a = 1$または$a = 0$）の下での同じ母集団における異なるリスクによって定義される。本書では、単に関連を意味する一般的な「効果」との混同を避けるため、「因果効果」という冗長な表現をしばしば用いる。

これらの根本的に異なる定義は、”association is not causation “というよく知られた格言を説明するものである。われわれの集団では、治療を受けた者（$7/13$）の死亡リスクは治療を受けなかった者（$3/7$）よりも高かったので、関連はあった。しかし、すべての人が治療を受けていた場合のリスク（$10/20$）は、すべての人が治療を受けていなかった場合のリスクと同じであったため、因果関係はなかった。心臓移植を受けた人が移植を受けなかった人よりも平均的に病気であったとしても、この因果関係と関連性の不一致は驚くべきことではない。第7章では、この不一致を交絡と呼ぶ。因果推論には表1.1の仮説データのようなデータが必要であるが、我々が期待できるのは表1.2のような現実世界のデータだけである。そこで問題は、どのような条件下で現実世界のデータを因果推論に使えるかということである。次の章ではその答えの1つを示す。

（関連と因果の違いは非常に重要である。例えば、5年死亡率の因果関係リスク比が、アスピリンを投与した場合と投与しなかった場合で0.5、それに対応する関連リスク比は1.5、これは心血管死のリスクが高い人が優先的にアスピリンを投与されるからである。この結果を知った医師は、アスピリンを投与された患者は未投与の患者に比べて死亡リスクが高いため、患者からアスピリンを差し控えることにした。この医師は医療過誤で訴えられるだろう。）