[Stata]媒介分析について

Stataでの媒介分析

paramedを用いる。まずはDAGから。下の図をみてわかる通り、\(X\)を説明変数、\(Y\)を目的変数として、\(M\)は媒介変数となる。研究の目的としては、\(X\)がどれだけ\(Y\)を説明するかを見たいのに、\(M\)が介在することによって、直接的な効果を図ることが困難になる。

見たいのは\(X\)から\(Y\)に向かう赤い経路であるが、\(M\)が介在することによって、直接的な効果を図るのが困難になる。

基本的なアプローチ

そこで、基本的なアプローチとして、差を作ることを行う。数式は$$\begin{eqnarray}E[Y\mid X, C] & = & {\alpha}_0 + {\alpha}_1 X + {\alpha}_2^{T} C \\ E[Y\mid X, M, C] & = & {\beta}_0 + {\beta}_1X + {\beta}_2 M + {\beta}_3^{T} C\end{eqnarray}$$である。ここで、\(X\)は説明変数、\(Y\)は目的変数、\(C\)が共変量、\(M\)が媒介変数である。仮に\(M\)で調整後説明変数の効果が減少した場合、それは\(M\)の指標となる。ここで、\(X\)が\(Y\)に与えるTotal Effect (TE)は\({\alpha}_1\)であり、Direct Effect (DE)は\({\beta}_1\)である。Indirect Effect (IE)は\(TE – DE = {\alpha}_1-{\beta}_1\)となる。

伝統的なアプローチ

Baron, Kennyにより1986年に導入されたのが、積を作る手法である。ここでは、$$\begin{eqnarray}E[Y\mid X, M, C] & = & {\beta}_0 + {\beta}_1 X + {\beta}_2M + {\beta}_3^{T} C \\ E[Y\mid X, C] & = & {\gamma}_0 + {\gamma}_1X + {\gamma}_2^{T} C\end{eqnarray}$$である。Indirect Effectは積を作り計算され、\(DE = {\beta}_1, IE = {\gamma}_1\cdot {\beta}_2\)である。また、\(TE = DE+IE\)となる。この手法は生存分析にも用いられるので、広く普及した。Stataは公式にはこの手法をカバーしていないが、lincomやnlcomコマンドで容易に行えるとある。

その他の媒介分析

Structual equation modeling (SEM)は共変量間の関連を見るのにフレキシブルな手法である。SEMは一般化線形モデルに基づいている。共変量間の直接的な依存性をみるのに広く用いられており、計量経済学や社会科学で主要な方法であるが、変数の線形性と正規性を仮定しており、さらに測定されていない交絡因子がない、という仮定を置いているため、疫学での使用には限界がある。SEMのコマンドは以下になる。

sem (M <- X C1 C2)(Y <- M X C1 C2)

説明変数と媒介分析の交互作用項

paramedによる媒介分析を理解するのに重要になるのが、以下のモデルになる。

$$\begin{eqnarray}E[Y\mid X] & = & {\alpha}_0 + {\alpha}_1 X \\ E[Y\mid X, M ] & = & {\beta}_0 + {\beta}_1 X + {\beta}_2 M + {\beta}_3 X\cdot M \\ E[M\mid X] & = & {\gamma}_0 + {\gamma}_1 X \end{eqnarray}$$

このように交互作用項をつくることにより、\(X\)から\(Y\)への経路を\(4\)個に分解している。これは”Four-way decomposition of the total effect”という(Vanderweele, 2014)。実際には図を見るのがわかりやすい。\(1\)がDirect Effect (controlled), \(2\)が\(M\)の効果単独によるNatural Indirect Effect, \(3\)が\(M\cdot X\)(相互作用項)によるReference Interaction, そして\(4\)が\(M\)と\(X\cdot M\)によるMediated Interactionである。Stataではcde:controlled direct effectというのが\(1\), nde:natural direct effectというのが\(1+3\), nie:natural indirect effectというのが\(2\),mte:marginal total effectというのが\(1+2+3+4\)になる。

four way decomposition

Stataのコマンド

paramedはdefaultでインストールされていないので、以下で取得する。

ssc install paramed

コマンドは以下。

paramed varname, avar(varname) mvar(varname) a0(real)
a1(real) m(real) yreg(string) mreg(string)
[cvars(varlist) nointeraction casecontrol fulloutput
c(numlist) bootstrap reps(integer 1000) level(cilevel)
seed(passthru)]

paramedの直後に目的変数、avarの中が説明変数、mvarがmediation、a0はnatural level treatmentなので通常は0、a1は曝露状態なので1、mはfour-decomposition wayが計算される媒介変数の値、yregはoutcomeに対する回帰モデル、mregはmediationに対する回帰モデル、cvarがcovariateになる。

yregの中には”linear”, “logistic”, “loglinear”, “Poisson”, あるいは”Negative binomial”が指定できる。mregは”linear”か”logistic”のみ。

関連記事

https://www.stata.com/symposiums/biostatistics-and-epidemiology21/slides/Bio21_Bellavia.pdf
https://www.stata.com/meeting/italy13/abstracts/materials/it13_grotta.pdf
共変量と交絡因子
Difference in Difference 差の差分法

コメント

タイトルとURLをコピーしました