[Statistics][Mendelian randomisation]メンデルランダム法とはなにか。

Table of Contents

出典

BMJの記事から。

https://www.bmj.com/content/362/bmj.k601

また、Tylerの解説記事も参照した。

Just a moment...

また、実際の手順については以下のprotocol記事を参照した。

Mendelian randomization - Nature Reviews Methods Primers

Mendelian randomization is a technique for using genetic variation to examine the causal effect of a modifiable exposure on an outcome such as disease status. T...

さらに、Rのpackageについてはこちら。

MendelianRandomization: an R package for performing Mendelian randomization analyses using summarized data

Abstract. MendelianRandomization is a software package for the R open-source software environment that performs Mendelian randomization analyses using summ

Mendelian randomisationメンデルランダム法

メンデルランダム法は、遺伝的変異を自然実験として用い、観察データにおける修正可能なリスク因子と健康アウトカムとの因果関係を調べるものである。すべての疫学的アプローチと同様に、メンデルランダム化の研究から得られる知見は、特定の仮定に依存している。これらの仮定の妥当性を評価するために使用できるメンデルランダム化研究で通常報告される情報の説明と、他のエビデンス源との関連においてメンデルランダム化研究で得られた知見をどのように解釈するかのガイダンスを提供する。

ポイント

・メンデルランダム法は、遺伝的変異を自然実験として用い、修正可能なリスク因子と疾患との推定される因果関係について証拠を提供する研究手法である。
・メンデルランダム化は、従来の観察研究よりも交絡因子や逆因果の影響を受けにくい。
・しかし、他の分析手法と同様に、メンデルランダム化はある種の仮定に依存しており、これらの仮定の信憑性を評価する必要がある。
・さらに、臨床的な判断のための結果の妥当性は、他のエビデンスに照らして解釈されるべきである。

はじめに

バイオマーカーや行動が健康を害するかどうかを理解することは、エビデンスに基づく医療、医薬品開発、より良い情報に基づく臨床的意思決定の中心である。理想的には、因果関係のエビデンスは適切に実施された無作為化試験から得られる。臨床医は、このような試験の長所と限界について熟知しており、従来の観察研究の分析についても、ますます高度に理解している。しかし、最近開発されたメンデルランダム化と呼ばれる観察データの解析方法の長所と限界についてはあまり知られていないかもしれない。メンデルランダム化研究および関連する手法の実施・報告に関する手引きは数多く存在するが、ここでは臨床医や実務家が手引きに目を通し、解釈できるようにすることに焦点を当てる。目標は、メンデルランダム化法の中核的な概念と最近の発展について説明することである。

交絡を克服するための方法

メンデルランダム法は、人々の健康に影響を与える修正可能な危険因子の操作変数として遺伝的変異を用いる分析法である。観察研究から導かれるエビデンスの主要な限界である未測定の交絡を克服できるため、利用頻度は高くなっている。例えば、アルコールと冠状動脈性心疾患のリスクとの関係を総合的に理解するために、アルコール摂取の血圧に対する影響を調査したかったとする。エビデンスの1つは、観察研究におけるアルコールと血圧の関連性である。この関連は、アルコール摂取と血圧の両方に影響を及ぼす他の因子（交絡因子）がある場合には、アルコールの因果関係を示す指標としては不十分な場合がある。多くの疫学的手法は、観察された交絡因子の研究参加者間の差異を補正し、あるいは最小化することを試みている。これらの方法は、十分な交絡因子を測定し、調整またはマッチングを行った後、異なる量のアルコールを摂取した研究参加者が比較可能であるならば、因果関係に関する有用な証拠を提供することができる。しかし、この仮定は検証不可能である。もし、この仮定が成り立たなければ、観察研究の結果は因果関係の推定値に偏りを持つことになる。

アルコール摂取量が多い人は、アルコール摂取量が少ない人に比べて喫煙量が多いなど、心血管系疾患の他の危険因子も持っている可能性がある。交絡因子（喫煙）は、危険因子（アルコール）と結果（血圧）の間の正の関連を誘発するが、これを因果関係と解釈することは誤解を招くであろう。交絡因子の測定は、その特徴を完全に表すものではないので、測定誤差は見かけ上統計的に調整した後でも、交絡の残存につながる。逆因果は、説明するのが難しい交絡の一形態である。これは、転帰または転帰につながる疾患の前臨床的側面が危険因子に影響を与える場合に生じる。例えば、心血管疾患の症状がある人は、症状がない人に比べてアルコールの消費量が少ないかもしれない。これは、危険因子（アルコール）と結果（心血管系疾患）の間の負の関連につながるが、これをアルコールの消費によって心血管系疾患のリスクが減少するからだと解釈すると誤解を招く。

メンデルランダム法は、受胎時に固定される遺伝的変異を利用して、修正可能な危険因子の影響に関する因果関係を推論するもので、ある種の交絡を克服することができる。アルコールと血圧の場合、東アジアの集団に見られるALDH2遺伝子の変異体（具体的にはrs671の野生型またはメジャーアレルGではなくマイナーAアレル）は、アセトアルデヒドの代謝を遅らせ、アルコール摂取によるフラッシュ反応やその他の有害反応を引き起こす。一般集団から選ばれた4,057人を対象とした調査では、1,919人のうち170人がA対立遺伝子を2コピー持ち、1日平均1.1 gのアルコールを飲んでいたのに対し、コピーを持たない人は23.7 g飲んでいた。対立遺伝子を1コピー以上持つ男性の血圧が低いということは、アルコール摂取量が少なければ血圧が下がることを示唆している。しかしこの推測にはいくつかの仮定が必要である。メンデルランダム化研究を読むときの2つの重要な課題は、基礎となる仮定の妥当性を評価することと、結果を解釈することである。以下では、用語集で定義されている用語を用いて、これらの課題について説明する(Box.1)。

概念
操作変数	関心のあるリスク因子と関連し、交絡因子と関係がなく、リスク因子によってのみ結果に影響を与える変数である。操作変数とは、これらの条件を満たすあらゆる形質（必ずしも遺伝的変異体である必要はない）であるが、遺伝の性質上、遺伝的変異体はしばしば操作変数としてもっともらしいと言える。
メンデルランダム化	遺伝的変異体を操作変数として用い、疾患の修正可能な危険因子の影響を調査する。
複数の操作変数	メンデルランダム化分析における複数の遺伝的変異体の使用。
アレルスコア	対象となる危険因子の増加に関連する対立遺伝子の数。これらの遺伝的変異は、通常、大規模なゲノムワイド関連研究(GWAS)において同定される。各バリアントを危険因子との関連性の大きさで重み付けすることにより、アリルスコアの統計的効率（検出力）を高めることができる。
弱い操作バイアス	メンデルランダム化研究において、危険因子の変動のごく一部しか説明しない1つまたは複数の遺伝子変異を使用した場合に、サンプルサイズが小さいと同時に発生することがある。
多面的効果	ある遺伝的変異が複数の生物学的経路に及ぼす影響。これらは、水平多面性として知られる調査対象の形質または経路とは別の形質または経路を通じて結果に影響を与えるか、垂直多面性として知られる調査対象のリスク因子を通じて他の形質に影響を与えるかのいずれかである。水平多面性は、結果に対する遺伝的変異の影響がリスク因子のみを通じていないため、操作変数仮定に違反するもので、これはメンデルランダム化研究にとって問題である。垂直多面性は、ある因子が下流の結果に影響を与えるというメンデルランダム化の本質であり、一般に問題とはならない。
統計手法
単一標本メンデルランダム化	操作変数分析で1つのデータセットを使用し、結果に対する危険因子の因果関係の推定値を得る。
2標本メンデルランダム法	2つの異なる研究標本を用いて、操作変数-危険因子及び操作変数-結果の関連を推定し、危険因子の結果に対する因果関係を推定する。これは、危険因子や結果、あるいはその両方が測定するのに高価である場合に有効である。また、大規模なコンソーシアムを含む複数のソースからのデータを取り込むことで、統計的検出力を大幅に向上させる機会も提供する。
MR Egger回帰	1つ以上の遺伝子変異が多面的な効果を持ち、その多面的効果の大きさが目的の危険因子に対する遺伝子変異の効果の大きさと独立している限り、許容される統計手法。
遺伝子計測機器の特性
観察研究とメンデルランダム化の間の検定	推定値の検定には、Hausman検定（単一標本のメンデルランダム化における連続アウトカムについて）と推定値の差の検定（単一標本および2標本のメンデルランダム化におけるバイナリアウトカムについて）がある。
操作変数の検定	操作変数（遺伝的変異体）と危険因子の間の関連性の強さを評価する。

Box1. メンデルランダム化研究でよく使用される用語の一覧。

メンデルランダム化はどのような仮定に基づいているか

有効な操作変数とは、次の\(3\)つの重要な仮定によって定義される。1つ目に、興味のあるリスク因子と関連すること（関連性の仮定）、2つ目に結果と共通の原因を共有しないこと（独立性の仮定）、最後にリスク因子を通してでなければ結果に影響しないこと（除外制限の仮定）である。もし、その変異体と危険因子を結びつける生物学的プロセスがよく理解されていれば、単一の遺伝的変異体がこれらの条件を満たすことはもっともなことであろう。しかし多くの場合、メンデルランダム化試験には複数の遺伝的変異が含まれ、感度分析で基礎となる仮定を評価するために使用することができる。一般的に、\(3\)つの重要な仮定は、それぞれの遺伝的変異について成立していなければならない。これらの仮定の妥当性を評価するための一般的な戦略を説明し、可能であれば公表されている研究からの例を挙げよう。

以下はメンデルランダム化の例と仮定に反する可能性を示したものである。
(A)既存の病気や社会的な剥奪によるアルコール摂取と血圧の相関の交絡を描いた簡略化したDAGである。操作変数は、遺伝子変異が危険因子に関連し、アルコール以外には結果に影響を与えないという仮定である。そして、遺伝的変異と結果の関連には交絡因子が存在しないことである。(B）アルコール摂取に関連する変異体が、サンプリングされた集団の異なる民族グループで異なる頻度を持ち、文化的な違いが民族間の血圧に影響を与える場合、家系による交絡が生じる可能性がある。これは、第二の操作変数仮定（独立性の仮定）に反することになる。

(C）水平方向の多面性の例。アルコール摂取に関連する遺伝子変異がタバコの消費にも影響する（第3の仮定（除外制約の仮定）に反する）。(D）垂直多面性の例。ALDH2の冠動脈疾患への影響は血圧を媒介としている。この例は、メンデルランダム化の仮定に違反せず、バイアスを生じさせない。

どういったときにこの\(3\)つの仮定に反するのか、Tylerの解説には具体例が豊富に掲載されていてわかりやすい。

メンデルランダム化におけるデータソース

歴史的に、典型的なメンデルランダム化研究では、同じ標本から遺伝子型（ALDH2遺伝子の変異体）、危険因子（アルコール摂取）、結果（血圧）を測定することが必要であった。この方法は、単一標本メンデルランダム化として知られている。例えば、ALDH2遺伝子型とアルコール摂取量に関するデータを一方のサンプルで、ALDH2遺伝子型と血圧に関するデータをもう一方のサンプルで測定する。このデザインには2つの利点がある。1つは、危険因子も結果もすべての研究で測定する必要がないことで、測定が困難であったり高価であったりする場合に特に有効である。第二に、GWASの要約結果を使用することができ、これは非常に大規模（しばしば>50000）であるため、非常に正確である。通常、2標本研究の方が、統計的検出力がはるかに高い。この利点には、2つのサンプルが同じ母集団を代表していると仮定し、2つのサンプル間の参加者の重複がリスク因子と結果の関連にバイアスを引き起こす可能性があるという、2つの追加的な前提がある。

単一または複数の遺伝子バリアント

メンデルランダム化の最も単純な応用は、危険因子の操作変数として単一の遺伝的変異を使用することである。報告された研究の中で最も説得力のあるものは、機能が比較的よく理解されている単一の遺伝子変異を用いたもので、核となる仮定が生物学的知識によって裏付けられているものである。この遺伝子は、肝細胞上のLDL受容体を分解する酵素であるプロタンパク質転換酵素サブチリシン/ケキシン9型(PCSK9)の機能を変化させるものである。PCSK9の変異体は、LDLコレステロールの血中濃度の変化や心臓病のリスクと関連している。このことは、LDLコレステロールが心臓病を引き起こすという証拠をさらに示すとともに、PCSK9を阻害する薬剤が心血管系に良い影響を与える可能性を示している（その後第III相臨床試験で確認された）。

しかし、ほとんどの場合単一の遺伝的バリアントは、一般的に表現型の変動の非常に小さな割合しか説明しない。研究者は、特に小さなサンプルサイズでは、これらを「弱い操作因子」と呼ぶことがある。特にサンプル数が少ない場合、弱い効果を持つバリアントを用いた研究は、統計的検出力が非常に低く、バイアスがかかる可能性がある。これを克服するために、研究者は、単一のバリアントよりもリスク因子の変動の多くをまとめて説明し、したがってより高い統計的検出力を有する複数の遺伝子バリアントを使用する方法を開発してきた。複数の遺伝的変異を用いる方法の1つは、単一または2標本のデータセットの設定において、統計的回帰モデルにおいて一塩基多型（SNP、人々の間で最も一般的なDNA変異の形態）を個々の操作として用いることである（複数操作アプローチ）。第二の方法は、変異体をアレルスコア（遺伝的リスクスコア、遺伝子スコア、多座標アレルスコアとも呼ばれる）に集約する方法である。アレルスコアは、事実上、メンデルランダム分析において危険因子を予測するために用いることができる単一の操作変数である。これらのスコアの遺伝的変異は、統計的検出力を最大にするために、しばしば危険因子との関連性によって重み付けされる。最近の複雑な形質（血圧、BMI、血中脂質など）のメンデルランダム化研究の多くは、多変量性や基礎となる仮定の違反を特定するのに役立つため、複数の変種を使用している。

遺伝的多面性

遺伝子変異は、対象となる危険因子を介さない経路で結果に影響を与える可能性がある（いわゆる水平多面的効果、上図C）。例えば、アルコール摂取に関連する遺伝的変異は、喫煙などの他の行動に影響を与える可能性があり、その場合は除外制限が無効になる。単一または複数の遺伝子変異を使用する場合、メンデルランダム化推定では、遺伝子変異がそのような水平多面的効果を持たないことが要求される。これは、遺伝子変異またはアレルスコアが、目的の危険因子を介さない結果に対する多面的効果を持つ場合、結果に偏りが生じる可能性があることを意味する。また、遺伝的変異は、対象となるリスク因子の影響を受ける経路を通じて結果に影響を与えることもある（垂直多面的効果、図1D）。これは操作変数仮定を無効にするものではなく、バイアスをもたらすものではない。

遺伝的多面性を考慮した様々な手法が開発されている。これらは、すべてのバリアントが多面的効果を持たないという仮定に知見が依存するかどうかを調べるために、有用な感度分析を提供するものである。このような手法のひとつは、中央値推定量として知られ、少なくとも半分の遺伝的変異が多面的効果を持たない限り、信頼できる証拠を提供することができる。MR Egger回帰として知られる2番目の方法は、すべてのバリアントが多面的効果を持つことを認めるが、それが目的の危険因子に対するバリアントの効果に比例しないことを条件とするものである。形質横断的な遺伝的影響の包括的な分析によると、ゲノムワイドな関連の大きさは、一般的に因果関係のない形質間で独立しているので、この仮定は多くの潜在的な関係に対して妥当であると思われる。MR Egger回帰は、検出力のペナルティにより、他の方法よりも精度の低い推定値が得られる。これらの方法のほとんどは、危険因子がすべての人に同じ影響を及ぼすと仮定している。

主要な前提条件をどう評価するか

操作変数の強度のテスト-関連性の仮定

メンデルランダム化研究の検出力は、サンプルサイズと提案された操作変数と危険因子の間の関連の強さによって決定される。危険因子をうまく予測できない弱い操作変数は、\(3\)つの問題を引き起こす。まず、仮説の検定に必要な統計的検出力がほとんど得られない。次に、バリアントの水平多面性効果など、操作変数の仮定に違反することによるバイアスが増幅されることである。第三に、非常に大きな標本を用いた場合でも、弱い操作変数を用いた結果は、単一標本の設定では結果・危険因子間の関連に偏り、\(2\)標本の設定では帰無に偏るということである。精度（信頼区間で評価）は過小評価される。弱い操作変数は、単一標本設定のF統計量を用いて検出することができる。経験則では、F統計量は\(10\)より大きくなければならない。この閾値を超えることは、有効な操作変数に基づく結果が弱い操作バイアスに大きく悩まされることはないはずであるが、特定の仮説を検定するのに十分な統計的検出力が保証されないことを示す。

独立性・排他性制約の前提

独立の仮定（交絡因子なし）及び除外の制限（遺伝学的手法はリスク因子を通じてのみ機能する）の違反による交絡は、無作為化試験における治療群間のベースライン特性のバランスに類似した、遺伝学的手法と幅広い特性の関係を推定することにより調査することができる。これらの評価は、独立性と除外制限の仮定が成り立つことを証明することはできないが、それらの（欠如した）妥当性に関する証拠を提供することはできる。例えば、アルコール摂取に影響することが知られている遺伝的変異は、ある社会における子供や女性など、ほとんど飲まない・あるいは全く飲まない集団の結果とは関連がないはずである。これは、除外制限と独立性の仮定を検証するものである。もし、研究者が飲酒しない集団でALDH2変異体と血圧の関連を発見した場合、操作変数仮定は元の集団でも成り立たないかもしれない。ネガティブコントロールの有用性は十分な根拠があり、もちろん利用可能であることによる。

メンデル無作為化試験はどのように分析されるか？

最も単純な方法は、遺伝的変異と転帰の関連を報告することである。この検定は比較的堅牢であり、すべての研究で報告されるべきである。これは、危険因子が結果を引き起こすかどうかについてのエビデンスを提供するが、エフェクトサイズについては情報を提供しない。因果効果の大きさは、遺伝的変異と結果の関連を遺伝的変異と危険因子の関連で割ることによって推定できる。この比率は、操作変数推定値またはWald推定値として知られている。

関心のあるリスク因子を含む、あるいは層別化する

ある遺伝的変異（またはいくつかの組み合わせ）が主要な危険因子を通して結果に対する影響を媒介するかどうかを評価するために（したがって除外制限を検定するために）、いくつかの研究では、関心のある主要な危険因子について調整または層別化を行っている。しかし、これにはいくつかの問題がある。第一に、危険因子で調整した後に遺伝子と疾患との関連性が残っていても、その変異が他の経路を通して疾患に影響を与えるとは限らない。測定された危険因子が、その遺伝子によって測定された形質の生涯変動を完全に説明することはほとんどない。従って、（測定されたリスク因子で調整した後の結果に対する）遺伝子の残余効果は、除外制限の仮定違反を示さないかもしれない。第二に、危険因子を調整したり層別化したりすることは、”治療中 “反応によるサブグループ解析を行うことが試験の無作為化を壊すのと同じように、コライダーバイアスにつながる可能性がある（補足図1参照）。その理由を知るために、冠状動脈性心臓病に対するスタチンの効果を調査する研究を考えてみる。治療中の（または “達成された”）LDLコレステロール濃度は無作為化を解除するものであり、脂質値に影響を及ぼす他の特性（年齢、性別、食事、身体活動など）によって偏りが生じる可能性が高い。これは無作為化試験における用量反応関係を明らかにしようとする、一見一般的なレトロスペクティブ・アプローチであるが、このような解析は観察解析と同様に交絡の影響を受けやすい。同様に、メンデルランダム化分析で危険因子を調整（または層別化）すると、遺伝的変異と結果の間に偽の相関を誘発する可能性がある。

メンデルランダム化研究の中には、なぜ他の形質で調整するものがあるのか？

遺伝的変異が有効な操作変数である場合、他の共変量を含めることは必要ではないが、統計的効率を高めることができる。メンデルランダム化研究の中には、直接測定された形質（年齢、性別、喫煙など）や遺伝的手段と対象リスク因子以外の形質との関連など、他の特性で調整するものもある。遺伝的変量とリスク因子と遺伝的変量・結果の関連は、同じ共変量で調整されるべきである。そうでない場合、操作変数の推定値に偏りが生じる可能性がある。例えば、BMIの血圧への影響に関する\(2\)標本のメンデルランダム化研究で、BMIを調整した血圧GWASを用いた場合、推定値は信頼できないし、効果の方向が逆になる可能性さえある。これらの問題は、方法論的な研究が活発に行われている分野である。

サンプルによっては、遺伝的変異と結果の関連性が、隠れた集団構造によって混乱させられることがある。これは、遺伝的祖先を調整するか、民族的に均質なサンプルに制限することで対処できる。ある研究が、東アジアとヨーロッパの民族的混合集団からデータを採取したとする。アルコール変異体rs671のマイナーアレルは、ヨーロッパの集団では極めて稀であるため、このサンプルにおけるこの変異体と転帰との関連は、民族の違いによるものかもしれない。この問題は、民族による層別化、または遺伝的主成分（Principle component analysis: PCA）で調整することにより軽減される可能性がある。例えば、UK Biobankでは、民族の違いによる遺伝的解析の調整のために、最大\(40\)の主成分を提供している。これは、脂肪率と心臓病及び糖尿病のリスクに関する最近のメンデル・ランダム化研究において行われたように、信頼性を向上させるものである。もし、ある研究がこのような調整に依存している場合、つまり、調整前と調整後の結果に大きな違いがある場合は、その結果は慎重に扱われるべきである。少なくとも、従来の疫学研究における残留交絡と同様に、潜在的なバイアスの原因を調査し、正当化する必要がある。

メンデルランダム化研究の中には、なぜ遺伝子の操作から変種を取り除くものがあるのか？

研究によっては、より信頼性の高い関連性の推定を行うために、多面的であると考えられる遺伝的変異を遺伝的操作変数から手動で除去（または「刈り取り」）するものもある。Voightらは、HDLコレステロールと心臓疾患との関係を調べるために、HDLコレステロールとの関連だけがある（LDLコレステロールやトリグリセライドとは関連がない）遺伝子変異を用いた。このように遺伝子変異を含めたり除外したりすることは恣意的であり、利用可能なデータによって制限される。このような刈り込みは、（可能であれば）慎重に、かつ十分に正当で透明性のある理由によってなされるべきである。さらに、サンプルサイズが大きくなるにつれて、遺伝的バリアントは、verticalまたはhorizontal pleiotropyによって複数の形質との関連を示すことが確認されるであろう。データの視覚的評価に基づいて、あるいはCookの距離のようなより正式なアプローチを用いて、明らかに外れ値である場合、1つまたは複数のバリアントを感度分析から除外することができる。

メンデル無作為化試験はどのように報告されるのか？

メンデルランダム化分析の前提条件が有効であることを確認した上で（表1）、このような研究がどのように報告されるかをよく理解しておく必要がある。これらの研究は、\(1\)つ以上の遺伝子変異と結果との関連を報告するか、結果に対する危険因子の因果関係（操作変数）の推定値を提供するか、またはその両方を報告する。Ferenceらは、LDLコレステロールを変化させるSNPsと心臓病のリスクとの関連を報告し、複数の独立した遺伝子座にまたがる用量反応関係の説得力のある遺伝学的証拠を示している。また、これらのSNPは、冠動脈性心疾患のリスクに対するLDLコレステロールの「全体的」な因果関係（LDLコレステロールが\(1\)mmol/L低くなるごとにオッズ比\(0.46\)、\(95\)％信頼区間\((0.41 \sim 0.51)\)を示すものである。これらの関連は、受胎時に生じる遺伝的差異を活用し、ライフコースのどの時点における危険因子の違いが結果に影響を与えるかを検出することができる。今後の研究や薬剤開発の指針として、メンデルランダム化の知見は、潜在的にリスク因子の生涯の差を反映していることを忘れてはならない。

調査結果の報告に関する特殊なケース

異なるSNPsからのメンデルランダム推定値間の差の検定

複数の遺伝子変異や生物学的経路がリスク因子に影響を与える場合、個人レベルのデータではハンセン検定、サマリーデータではコクランのQ検定を用いて、異なる変異を用いた場合にリスクファクターのアウトカムへの効果が類似しているかどうかを検定することができる。これらの検定統計量が大きい場合（それに応じてP値が小さくなる）、リスク因子の推定因果効果は、集団間または変種間で異なる可能性がある。これは、結果を引き起こす経路が複数あるためかもしれない。これらの検定が棄却されない場合、サンプルサイズと統計的検出力が不十分で、存在する差異を検出できない可能性があり、したがって、誤って安心させてしまう可能性がある。

同一データセットにおける観察的解析とメンデルランダム化解析の結果の比較

単一標本解析における連続的な結果については、Hausman検定を用いて、（同じデータセットから得られた）メンデルランダム化の結果と線形回帰の結果が系統的に異なるかどうかを評価することができる。メンデルランダム化の推定値は、危険因子の生涯にわたる摂動の影響を反映しているのに対し、線形回帰の結果は、より急性の影響を反映している可能性があるため、\(2\)つの方法によって推定される効果が同じでない可能性がある。メンデルランダム化の推定値は、ほとんどの場合、線形回帰よりも精度が低く、信頼区間が広いので、差の検定はしばしば統計的検出力が低くなる。

メンデルランダム化の結果はどのように解釈されるべきか？

メンデルランダム化研究で得られた知見は、交絡や逆因果バイアスの影響を受けにくく、従来の観察疫学と介入試験の間に位置するものである（図4）。うまく実施されたメンデルランダム化研究は、上記の前提を合理的に満たしているため、従来の観察研究よりも信頼性の高いエビデンスを提供することが多い。しかし、その所見は、異なる研究デザインを用いた他の情報源からの既存の証拠との関連で解釈されるべきであり、臨床ガイドラインは、メンデルランダム化の結果のみに基づいて書き直されるべきではない。

エビデンスの三重化

いくつかの研究では、従来の観察疫学に基づくメンデルランダム化推定値を報告している。関連性が異なるという明確な証拠がある場合、メンデルランダム化推定は、従来の観察的推定が交絡または逆因果から生じたものであるという強力な証拠を提供することができる。CRPと冠動脈疾患の場合、メンデルランダム化の推定値は、CRPを標的とすることは、冠動脈疾患の予防のための有効な治療標的とはなりそうもないことを示唆している。一方、メンデルランダム化の推定値が、観測値の推定値と重なり、Nullも含めて非常に広い信頼区間を持つ場合（乳製品の摂取と血圧の場合）、メンデルランダム化の結果からはほとんど推測することができない。

観察研究とメンデルランダム化研究の要約推定値は、コクランのQ検定や推定値の差の検定などの異質性の検定を使用して正式に比較することができる。これは、差の統計的証拠を提供できるが、これが臨床的に意味があると解釈されるべきかは、さらに以下に概説する。

臨床的および公衆衛生的な意味

臨床上および公衆衛生上、介入策を決定する際には、理想的には、特定の集団に対する効果の大きさと方向性に関する証拠が必要である。例えば、\(45\)歳から\(1\)日平均\(1\)杯のアルコール摂取を減らすと、\(5\)年後の血圧にどのような影響を及ぼすかを知りたいかもしれない。しかし、遺伝子変異は一般に、ある危険因子の生涯的な差異に関係し、特定の時期の影響には関係しないので、これには注意が必要である。ALDH2は、青年期から中年期にかけてのアルコール摂取と関連しており、メンデルランダム化の結果は、（生物学的知識と相まって）アルコール摂取を少なくすれば平均的に血圧が下がることを示しているが、人生の特定の時期、特定の期間における介入の効果の大きさを必ずしも示すものではない。もう一つの例は、ビタミンDと多発性硬化症の関係で、メンデルランダム化研究のデータは、予防効果を示しているが、そのような予防は、小児期と青年期に限られ、成人期にはないかもしれない。危険因子と結果の関係に関する生物学的および方法論の知識は、メンデルランダム化研究を解釈するのに非常に重要である。リスクは時間の経過とともに蓄積されるのか？危険因子は急性に作用するのか？この危険因子がこの疾病に影響を与える特定の時期があるか？

メンデルランダム化の結果を評価するために、生物学と文脈が重要である別の例について考えてみよう。CHRNA5遺伝子の変異体は、喫煙の多さと関連し、（喫煙行動を通じて）肺癌のリスク上昇と関連している。また、これらの変異体を持つ人は肺がんの診断後に喫煙を減らすことがより困難になる可能性が高い。しかし、この遺伝子の変異体は、肺がんの診断後の死亡率に対する禁煙や減煙の効果を評価するのには使えない。なぜなら、リスク変異体を持つ人は、診断前にもっと大量に喫煙しているはずだからである。CHRNA5リスク変異体と肺癌患者の死亡率との関連は、個人の生涯にわたるタバコ煙への曝露を反映しており、CHRNA5を用いた操作変数の推定が現在の喫煙の予後への影響を反映することは期待できないだろう。最も重要なことは、発病のきっかけと進行の要因は全く異なる可能性があるということである。このことは、疾患の治療に直接関連する知見を得るためには、疾患の発生ではなく、疾患の進行と予後に関する研究からのデータを用いてメンデルランダム化研究を行う必要があることを意味する。最後に、ある曝露が一見修正不可能に見える場合（身長など）、因果関係によって、疾病につながる潜在的なメカニズムや経路を指し示すことができる。そのような経路は修正可能である可能性が高く、疾病の病因に関する新たな知見を提供する。

要約

メンデルランダム化研究は、疾患や健康状態に対する修正可能な危険因子の影響について信頼できるエビデンスを提供することができ、従来の観察疫学のいくつかの限界を克服することができる。操作変数仮定が十分に正当化される設定（上記のように評価し、生物学的知識を用いる）において、その知見は臨床試験や医薬品開発の優先順位付けに役立ち、臨床や公衆衛生の意思決定に情報を提供することができる。

メンデルランダム化研究の実施、報告、解釈の方法に関する議論はまだ続いている。無作為化比較試験などの他の医学研究の分野では、方法論者、実証研究者、臨床医が密接に協力することで、大きく強化されてきた。メンデルランダム化の長所と短所を十分に理解し、実現するためには、同様の協力が必要である。