[statistics][統計][ランダム化臨床試験]ブロックランダム化とはなにか

close up photo of casino roulette statistics
Photo by Pavel Danilyuk on Pexels.com

なぜランダム化を行うのか

臨床試験とは、ある特定の薬剤や治療の効果を見るために行われる。臨床試験では様々なバイアス(bisa)、偏りが生じる。例えば、ある疾患(がんでもなんでもよい)に対して、内服治療と手術治療のどちらが優れているのかをみたいとする。このとき、ランダム化が行われていない試験ではどういったバイアスが生じるであろうか。外科医がこの試験を主導していたとする。外科医としては、当然内服よりも手術の優位性を示したい(と考えられる)ので、できるだけ状態がよく手術が成功しそうな患者を手術群に振り分け、あまり見込みのなさそうな状態の悪い患者を内服群に振り分けたいというインセンティブが働く(選択バイアス)。もちろん、このインセンティブは「状態が悪く、手術ができないから仕様がない」という言い訳によって正当化されうるのであるが、我々が本当に見たいのは「同じ状態の患者に対して、手術と内服とどちらが果たして効果があるのか」というリサーチクエッションなわけであるから、これでは困る。興味のある介入以外の、年齢や性別、健康状態など他の要因がすべて等しいことが望まれる。このためにランダム化という操作を行うのである。

単純ランダム化

実際に臨床試験を行うとき、例えば1万人の被験者を同時に集めて「あなたはAグループ」、「あなたはBグループ」と振り分けるわけにはいかない。試験開始から、順次リクルートを行い、一人ひとりインフォームドコンセントを行い、参加するたびに介入群と対照群どちらに振り分けるかを決める。

もっとも単純なのが、単純ランダム化である。被験者が来るたびに、コインを投げたり、乱数の偶数奇数で\(\displaystyle \frac{1}{2}\)の確率で介入群あるいは対照群かを決める。コンピュータで乱数を発生させる場合、厳密には本当の意味で乱数とは言えない。つまり、何らかの計算プログラムによって生み出される場合、その規則から次にどんな数字が出るかを推測しうるからである。そういった意味ではコンピュータの生み出す乱数は擬似乱数と呼ばれるが、実用上大きな問題にはならない。

ブロックランダム化

単純ランダム化の問題点はなんだろうか?今、\(10\)人の参加者が集まり、これを\(2\)グループに分けるとする。このとき、ちょうど人数が\(5\)人と\(5\)人に分かれる確率は\(\displaystyle \frac{_{10}{\mathbb{C}}_{5}}{2^{10}} = \frac{252}{2^{10}} = 0.25\cdots\)と意外なほどに小さい。参加者の数が増えればなるほど半々になる確率は\(0\)に近づく。すなわち、\(\displaystyle \frac{_{2n}{\mathbb{C}}_{n}}{2^{2n}}\)は\(\displaystyle n\to \infty\)のとき\(0\)に収束する。つまり、偏りが生じることは避けられない。このように単純ランダム化では介入群と対照群の人数をコントロールすることが困難である(ただし、参加者の数を増やすことで極端な食い違いが起こることを避けることはできる)。

最も極端な例は、参加者が\(2\)人の場合であろう。\(1\)を介入群、\(0\)を対照群とすると、組み合わせとしては\((1, 1), (1, 0), (0, 1), (1, 1)\)となる。つまり、参加者が同じグループに振り付けられる確率は\(\displaystyle \frac{1}{2}\)にもなる。そこで発想を変えて、取りうる組み合わせとして\((1, 0), (0, 1)\)のみを取る。参加者を逐次2人のグループに分けて、\((1, 0), (0, 1)\)をランダムに割り当てていく。このようにすることで人数のコントロールが可能になる。ブロックの人数は\(2\)人である必要はない。例えば4人のグループにすると、\((1, 1, 0, 0), (1, 0, 1, 0), (1, 0, 0, 1), (0, 1, 1, 0), (0, 1, 0, 1), (0, 0, 1, 1)\)という\(6\)つの組(\(\displaystyle _{4}{\mathbb{C}}_{2} = 6\))通りのうち一つをランダムに選び、被験者に振り分けていけば良い。一般的にブロックの数としては、\(4, 6, 8 \)人がよく用いられるようである。このようにブロックを作ることで、最終的な介入群・対照群の人数を(ほぼ)揃えることができる。

ただし、ランダムブロック化にも欠点がある。逐次割り当てていくので、最後の参加者がどのグループに来るのが分かってしまう。これは、ブロックサイズを\(2\sim 6 \)からランダムに選び、さらに割付担当者にブロックサイズを知らせないことで克服することが可能である。

関連記事

共変量と交絡因子
統計モデルにどのような確率分布を採用するか
与えられたデータの分布について確認する

関連リンク

https://www.jstage.jst.go.jp/article/eiyogakuzashi1941/65/5/65_5_255/_pdf

コメント

タイトルとURLをコピーしました