[Papers][Statistics]医学研究におけるシステマティック・レビューとメタ解析を成功させる24のステップ

people in the office discussing a project paper
Photo by Kindel Media on Pexels.com

A 24-step guide on how to design, conduct, and successfully publish a systematic review and meta-analysis in medical reserch

NCBI - WWW Error Blocked Diagnostic

の内容から。システマティック・レビューやメタ解析は確かにある程度定式化が可能なところ。24のステップは

  • システマティック・レビューを行う手法の簡略化
  • 医療従事者や研究者にシステマティック・レビューやメタ解析を行う健全な手法を提供する
  • および、既存のエビデンス統合にむけたエフォートの質を向上させる

ことを目的としている。本文中にあるw1, w2などはWeb Supplementを指す。

24のステップ

Step 1: Define research quesion

リサーチクエッション (RQ)を設定する。より良い疑問は、より良い戦略に結びつく。良いRQを立てるためには、その分野に習熟しなくてはならないし、必要であれば他のシステマティック・レビューやメタ解析を参照することもある。また、自分が研究を行おうとしている分野で既にシステマティック・レビューやメタ解析がある場合でも、新たな研究を行う障壁にはならないであろう。

明確に定義されたRQが、良いシステマティックレビューの礎となる。RQを設定する前に、PROSPERO(前向きに登録されたシステマティックレビューの国際的なデータベース)に、同じトピックや類似のトピックが登録されていないかチェックすることで、同じトピックに他の研究者が取り組んでいるかどうかを調べ、そのトピックに関する最近のシステマティックレビューの最新情報を確認する。最近、他の研究者が自分の興味あるトピックを扱っていなければ、PICOで定義された最も重要な4つの概念に研究課題を分解し、研究を進める。同じようなトピックに関する最近のレビューがあれば、既存のレビューと区別するためにRQを絞り込むことができる。

例を上げてみる。閉経後女性における閉経後ホルモン療法の投与経路、投与量、開始時期、期間と心血管リスクとの関連を検討したい。我々は、非経口的閉経後ホルモン療法が心血管リスクのマーカーに及ぼす影響について調査した、より具体的なシステマティックレビューを過去に発表していることを確認した。我々はホルモン療法の投与経路、投与量、タイミング、投与期間に興味があるため、RQはより広範であり、プロジェクトを続けるべきである。次に、PICOモデルを使ってリサーチクエスチョンを分解する。すべてのRQが、治療に関するRQに最も適したPICOモードに変換できるわけではないことに留意する。検索クエリにすべてのPICO項目を含めると、関連する論文を進められない危険性がある。更年期ホルモン療法は閉経期の女性にのみ行われるので、この例では、閉経後や女性という用語を検索に含める必要はない。この例では、投与経路、投与量、開始時期、治療期間などである。これらのトピックは、更年期ホルモン療法に関する論文の全文に記載されている可能性が高い。

PPatient problem/Population閉経後の女性
IIntervention閉経後ホルモン療法(投与経路、量、開始のタイミング、投与期間)
CComparison (if there is one)無治療群
OOutcome(s)動脈硬化、末梢動脈疾患、頚動脈内膜中膜厚、脳卒中、一過性脳虚血、心不全、冠動脈性心疾患、狭心症、胸痛、静脈血栓塞栓症
PICOの例。

Step 2: Establish the team

チームを作る。文献検索、リバイス、質の評価などには独立したレビューアーによるダブルチェックが必要になる。また、レビューアー同士の衝突を避けるため、第三のレビューアーが必要になることもあるだろう。臨床に偏りすぎた人選は、レビューの質を下げるかもしれない(Oxman AD, Guyatt GH. The science of reviewing research. Ann NY Acad Sci. 1993;703:125–33 discussion 33–4)。リーダーは必ずしも教授などである必要はなく、プロジェクトを調整し、研究プロトコルが遵守されているか確認し、すべてのチームメンバーと意思疎通が可能で、研究のすべてのフェーズで参加を促す事のできるものであることが望まれる。

以下のStep 3, 4, 5は並行して行われる。

Step 3: Define the search strategy

包括的な検索が必要である(単一のサーチエンジンですべての論文を把握しているものはない)。筆者らによると少なくてもEmbase, MEDLINE, Web of Science, そしてGoogle Scholarが範囲されていれば許容できるであろうとのこと。また、臨床試験を含む場合、Cochrane Libraryの追加も推奨される。が、必要なものはCochrane Libraryを検索せずとも、含まれていることが多い。精神医学や心理学の分野、あるいは看護や関連保健分野での執筆であれば、PsycINFOCINAHL databasesも検索に含まれるべきである。

検索戦略の策定は、RQの分析から始まる。RQのどの要素が検索において最も重要か?検索結果の感度を最適化するために、検索はできるだけ少ない要素で構成されるべきである。上の例のRQからは、更年期ホルモン療法と心血管リスクの2つの要素を選ぶ必要がある。

選択された各要素は、データベースで使用されるキーワードに変換される。キーワードには大きく分けて2つのセットがある: PubMedMEDLINEではMeSH(医学主題見出し)用語が使われ、Embaseの論文にはEMTREE用語が割り当てられている。これらのシソーラスは、検索戦略を立てるために、関連しそうな検索語を集める出発点となる。シソーラスからは、用語そのものだけでなく、その類義語(MEDLINEでは項目用語)も収集する必要がある。切り捨て(ほとんどのデータベースではこの目的でアスタリスク*を使用)を使用することで、単語のバリエーションを同時に検索することができる。

収集された用語は、同義語間のORと要素間のANDというブール演算子を用いて検索戦略に組み入れられる。近接演算子など、より複雑な演算子を提供するデータベースもあり、検索者は指定した距離内にある用語のセットを検索することができる。これにより、関連する文献の検索を大幅に増やすことができる。括弧は検索の優先順位を決定する。一般的にORはANDより先に実行されるべきであり、そのため各要素は括弧で始まり括弧で終わる。検索では、データベースに適したフィールドコードを使用し、シソーラス用語(ツリー内の狭い用語を含む)を展開し、シソーラス用語以外の検索はタイトルおよび/または抄録、著者キーワードに限定する。

文献検索の経験がない場合は、PubMedから始めるのが一番である。PubMedは最もシンプルな検索エンジンで、一度検索方法を覚えてしまえば、他のデータベースを検索するのも簡単になる。しかし、システマティックレビューの検索は、決して1つのデータベースに限定すべきではない。また、すべてのシステマティックレビューの検索は、経験豊富な医療情報の専門家が行うことが推奨される。

システマティック・レビューの正しい検索方法については、最近発表された方法論論文に詳しい説明がある。また、文献検索の基本的な原則を学ぶためのオンラインチュートリアルも多数ある。PubMedのオンライントレーニングは無料である。libguides.vu.nl/PMroadmapには、非常に体系的な方法に従った非常に優れたオンラインチュートリアルがある。

最近発表された介入研究のメタアナリシスについては、以下を例にあげる。このメタアナリシスでは、成人女性における、通常の食事とグルコースホメオスタシスを併用した植物エストロゲンの補給と、2型糖尿病リスクとの関連が評価されている。文献検索は5つの電子データベースを用いて行った: MEDLINE via Ovid、Embase.com、Web of Sci-ence Core Collection、Cochrane CENTRAL via Wiley、Google Scholarである。この例は、検索戦略の複雑さを反映し、異なる医学データベースの検索構文を示している。


Embase.com

(‘phytoestrogen’/exp OR ‘soybean’/de OR ‘soybean extract’/de OR ‘soybean protein’/de OR ‘soybean oil’/de OR ‘soybean meal’/de OR ‘soybean milk’/de OR ‘red clover’/de  OR ‘red clover extract’/de OR ‘isoflavone’/de OR ‘isoflavone derivative’/de OR ‘daidzein’/de OR ‘genistein’/de OR ‘soy food’/de OR (phytoestrogen* OR phytooestrogen* OR phyto-estrogen* OR phyto-oestrogen* OR soybean* OR soy OR ‘red clover’ OR Trifolium OR Isoflavon* OR daidzein OR genistein* OR flaxseed OR ((herb* OR plant*) NEAR/6 (estrogen* OR estrogen*)) OR tofu):ab,ti) AND (‘diabetes mellitus’/exp OR ‘insulin response’/exp OR ‘glucose blood level’/exp OR ‘insulin blood level’/exp OR hyperinsulinism/exp OR (diabet* OR ((glucose OR sugar OR insulin* ) NEAR/6 (level* OR blood OR serum OR plasma* OR concentration*)) OR glucosaem* OR glucosem* OR glycaem* OR glycem* OR hyperinsulin* OR hypoinsulin* OR insulinaem* OR insulinem* OR (insulin NEAR/3 (response OR dependen* OR resistan* OR sensitiv*)) ):ab,ti) NOT ([animals]/lim NOT [humans]/lim) NOT ([Conference Abstract]/lim OR [Letter]/lim OR [Note]/lim OR [Editorial]/lim)

Medline Ovid

(exp “Phytoestrogens”/ OR “Soybeans”/ OR exp “Soybean Proteins”/ OR exp “Soy Foods”/ OR “Trifolium”/  OR exp “Isoflavones”/ OR (phytoestrogen* OR phytooestrogen* OR phyto-estrogen* OR phyto-oestrogen* OR soybean* OR soy OR “red clover” OR Trifolium OR Isoflavon* OR daidzein OR genistein* OR flaxseed OR ((herb* OR plant*) ADJ6 (estrogen* OR estrogen*)) OR tofu).ab,ti.) AND (exp “Diabetes Mellitus”/ OR “Insulin Resistance”/ OR glucose/bl OR insulin/bl OR exp Hyperinsulinism/ OR (diabet* OR ((glucose OR sugar OR insulin* ) ADJ6 (level* OR blood OR serum OR plasma* OR concentration*)) OR glucosaem* OR glucosem* OR glycaem* OR glycem* OR hyperinsulin* OR hypoinsulin* OR insulinaem* OR insulinem* OR (insulin ADJ3 (response OR dependen* OR resistan* OR sensitiv*)) ).ab,ti.) NOT (exp animals/ NOT humans/) NOT (letter OR news OR comment OR editorial OR congresses OR abstracts).pt.

Cochrane

((phytoestrogen* OR phytooestrogen* OR phyto-estrogen* OR phyto-oestrogen* OR soybean* OR soy OR ‘red clover’ OR Trifolium OR Isoflavon* OR daidzein OR genistein* OR flaxseed OR ((herb* OR plant*) NEAR/6 (estrogen* OR estrogen*)) OR tofu):ab,ti) AND ((diabet* OR ((glucose OR sugar OR insulin* ) NEAR/6 (level* OR blood OR serum OR plasma* OR concentration*)) OR glucosaem* OR glucosem* OR glycaem* OR glycem* OR hyperinsulin* OR hypoinsulin* OR insulinaem* OR insulinem* OR (insulin NEAR/3 (response OR dependen* OR resistan* OR sensitiv*)) ):ab,ti) 

Web of science

TS=(((phytoestrogen* OR phytooestrogen* OR phyto-estrogen* OR phyto-oestrogen* OR soybean* OR soy OR “red clover” OR Trifolium OR Isoflavon* OR daidzein OR genistein* OR flaxseed OR ((herb* OR plant*) NEAR/5 (estrogen* OR estrogen*)) OR tofu)) AND ((diabet* OR ((glucose OR sugar OR insulin* ) NEAR/5 (level* OR blood OR serum OR plasma* OR concentration*)) OR glucosaem* OR glucosem* OR glycaem* OR glycem* OR hyperinsulin* OR hypoinsulin* OR insulinaem* OR insulinem* OR (insulin NEAR/2 (response OR dependen* OR resistan* OR sensitiv*)) ))  NOT ((animal* OR rat OR rats OR mouse OR mice OR murine) NOT (human* OR patient*))) AND DT=(article)

Google scholar

phytoestrogens|soybean|soy|”red clover”|Trifolium|Isoflavones diabetes|insulin|glucose
異なるデータベースでの検索例。

Step 4: Define selection criteria (inclusion/exclusion)

研究の透明性と再現性を保証するため、明確な基準を設定する。この基準は、当然RQにもよるであろうし、研究デザイン、出版日、地理的な制約にも左右されるだろう。あるいは研究対象集団の年齢、性別、疾患の有無や測定された曝露因子と目的因子の有無、研究に使用された解析方法や共変量の調整の有無なども重要である。選択基準の確立のための重要なステップは、RQに適合する研究デザインの評価である。よりエビデンスレベルの高い研究デザインを用いた論文を選択するのも重要であるが、どのような研究デザインがRQに適合するのか、も同じく重要である。適合・除外基準を設定した後には、チェックリストを記載する。これはレビューアーにとっても有用であるし、時間の節約になる。

以下に除外基準を含む、閉経後女性の内皮機能と心血管疾患リスクバイオマーカーに対する植物エストロゲンサプリメントの効果を調査するシステマティックレビューのチェックリストの例を示す。このレビューはPROSPEROに登録されており、試験実施計画書(ID:CRD42019121110)も掲載されている。

閉経後女性における植物エストロゲンサプリメントと内皮機能および心血管疾患リスクバイオマーカー:ランダム化比較試験のメタアナリシス
研究デザイン:ランダム化比較試験
曝露因子:植物性エストロゲン:レッドクローバー、トリフォリウム、イソフラボン、ダイゼイン、ゲニステイン、大豆、あらゆる種類の大豆ミール;リグナン類
治療介入:サプリメント、食事介入、カプセル/錠剤、あらゆる種類の植物エストロゲン介入
アウトカム:心血管疾患リスクマーカー
(炎症マーカー):TNF-α、ホモシステイン、レプチン、インターロイキン(1,6および8)、ロイコトリエン、ヒスタミン、プロスタグランジン、サイトカイン、高感度CRP、マロンジアルデヒド(MDA)、補体系、アンジオテンシン変換酵素(ACE);凝固系、線溶(プラスミン、フィブリノーゲン、トロンビン、フォンウィルブランド因子、トロンボモジュリン)
(酸化ストレス):活性酸素種(ROS)、脂質過酸化、イソプロスタン(IsoPs)とマロンジアルデヒド(MDA)、5-リポキシゲナーゼ、12-リポキシゲナーゼ、ミエロペルオキシダーゼ …
(血清脂質):コレステロール、トリグリセリド、低比重リポ蛋白コレステロール(LDL-C)、非比重リポ蛋白コレステロール(非HDL-C)、アポリポ蛋白A1、アポリポ蛋白B(Apo-B)
(内皮機能障害):内皮由来弛緩因子(EDRF)、一酸化窒素(NO)、プロスタグランジンI2(PGI2)、内皮由来過分極因子(EDHF)、内皮由来収縮因子(EDCF)、エンドセリン-1(ET-1)、亜硝酸塩、細胞間接着分子-1(ICAM-1)、血管細胞接着分子-1(VCAM-1)、E-セレクチン、P-セレクチン
動脈硬化と血管機能:
(動脈硬化):脈波伝播速度(PWV)、大動脈脈波伝播速度(PWV)、ブラジアル流動媒介拡張(FMD)、末梢動脈トノメトリー(PAT)
頸動脈内膜中膜厚、頸動脈アテローム性動脈硬化プラーク、頸動脈アテローム性動脈硬化症、冠動脈アテローム性動脈硬化症
適合基準
1. 閉経後女性を対象として実施された研究
2. 植物性エストロゲンと上記の転帰との関連を報告した研究
3. 言語または日付の制限なし
除外基準:
1. 動物研究
2. 男性を対象とした研究
3. 介入の組み合わせを調査した研究(例:植物性エストロゲン+低カロリー食、植物性エストロゲン+運動)
4. 情報が不完全な論文
5.症例対照研究、コホート研究、横断研究
6. 系統的レビューおよびメタ分析
7. 会議や学会報告

Step 5: Design data collection form

システマティック・レビューで鍵となるステップは、標準化されたデータ抽出フォームを用いた、一次研究からの適切なデータの抽出である。データは以下のように、

  • 研究者名、研究年度、資金源などの一般的な研究情報
  • 年齢、性別、人種を含む研究対象者の情報
  • 可能であれば評価手法を含んだ曝露因子や介入、研究対象の分布、薬剤の処方があるときは使用量。
  • アウトカム
  • 使用された統計的解析手法と、調整因子。
  • 関連性の測定、層別化分析、あるいは結果の一致度の分布など。

フォームの作成には、慎重な配慮が必要で、最終的な収集の前に、5つ程度の論文でパイロットの収集を行うのが良い。様々なソフトウェアが利用できる。例えば、MicrosoftのAccess/ExcelやQualtrics, REDCap, Google Formes/Sheets, SRDR (Systematic Review Data Repository)などである。その他にも、CovidenceDistillerSRといったソフトウェアが知られている。

データ収集フォームには、データを分析する際に必要な最も重要な情報を含める必要がある。下の例では、Excelで作成したフォームを見ることができる。含まれる研究は、相対リスク(RR)、下限信頼区間(LCI)、上限信頼区間(UCI)を報告した前向き観察研究である。データをプールする際には、参加者数と症例数が必要である。また、その他に必要な情報としては、筆頭著者名と発表年を含めることが重要である。何を必要とするかは、データを使って何をするかによって異なる。層別化解析を計画している場合は、研究のタイプ(コホート対症例対照)、場所、平均年齢、平均参加者数、性別の情報も抽出することができる。

Excelを用いたデータ収集フォームの例。

Step 6: Write the study protocol and register the review

研究計画書には、研究課題、第一および第二の目的、研究デザイン、包含・除外基準、電子的検索戦略、分析計画が詳細に記載されている。研究計画書は、査読者がスクリーニングを行う際の指針となる。プロトコールを作成する際には、関連する専門家にフィードバックを求め、プロトコールがすべての要素を網羅していることを確認する。w6にプロトコールの例が示されている。重複や余計な努力を避け、透明性を確保するために、審査を登録することが推奨される。登録のためのプラットフォームはいくつかあるが、最もよく利用されるのは、医療や社会的ケアに関するレビューならProspero、介入に関するレビューならCochraneである。Prospero にレビューを登録する方法は、w7 に記載されている。

Step 7: Run the search strategy in multiple databases

ステップ3で述べたように、文献検索には少なくとも4つのオンラインデータベースを含める必要がある: Embase, MEDLINE, Web of Science, Google Scholarである。それぞれのデータベースには、検索戦略の書き方がある。

Step 8: Collect all references and abstracts in a sigle file

EndNote、またはCovidence (www.covid ence.org)、Dis-tillerSR (www.disti llerc er.com)、Rayyan (rayya n.qcri.orgrayyan.qcri.org)などの他のツールに、ステップ7の研究結果をすべて集める。 利用できる場合は、ステップ9をサポートしているEndNoteの使用を推奨する。データベースから選択した文献をEndnoteファイルにインポートするには、EndNoteが認識する形式でデータベースから文献をエクスポートする。主なデータベースからEndNoteへの引用文献のエクスポート方法は、w8に記載されている。

Step 9: Eliminate duplicates

様々なデータベースから関連研究を検索することは、一般的に論文を複数回同定することにつながる。重複記録の削除は、タイトルや抄録をスクリーニングする際の査読者の作業負荷を軽減する。データベース内の論文は異種混合であるため、重複除去は煩雑で時間がかかる。EndNoteを使用して、より迅速かつ正確に重複排除を行う方法も発表されている。他にも重複排除のためのソフトウエアはあるが、その精度は十分に評価されていない。

Step 10: Have at least two reviewers screen title and abstract

各文献のタイトルおよび/または抄録は、少なくとも2名の査読者が関連性を審査する。各文献が2名の独立したレビュアーによってスクリーニングされている限り、1 名ですべての文献をスクリーニングする必要はない。例えば、一人のレビュアーがすべての文献をスクリーニングし、2 回目のスクリーニングではすべての文献を他のレビュアーに分担させることもできる。タイトルと抄録を同時に審査し、タイトルに関連性があると判断された場合、抄録の関連性を判断することもできる。紙でスクリーニングを行っていた以前のように、最初にタイトルをスクリーニングし、その後に抄録をスクリーニングする必要はない。この段階では、論文の全文ではなく、タイトルと抄録に適用された選択基準に基づいて文献が選択される。抄録がなく、タイトルしかない文献は、次のステップに含める。この段階では、除外の理由を記録しておく必要はない。タイトルと抄録のスクリーニング段階には、RayyanCovidenceDistill-erSRなどの様々なソフトウエアアプリケーションが利用できる。この目的のためにExcelを使用するのは、複雑で時間がかかるため推奨しない。Step 9にもある、EndNoteを使ってタイトルと抄録をスクリーニングする方法は非常に高速で、1時間にスクリーニングされた文献の中央値は300件であった。タイトルと抄録のスクリーニングは、他のソフトウェアでも実行できる。 Rayyan、Covidence distiller srは、これらのサービスを提供するツールである。Rayyanは人工知能を使って、まだスクリーニングされていない文献の中から最も可能性の高い文献を決定する。これが信頼できるものであれば、レファレンスのスクリーニングに必要な時間を短縮することができる(しかし、今のところまだ信頼されていない)。つまり、関連性ランキングにもかかわらず、通常はすべてのリファレンスをスクリーニングしなければならない。筆者らの経験では、ほとんどのツールは、各参照を含めるためのアクションを必要とする。Endnoteの方法では、複数の文献を一度に除外することができるので、スクリーニングに必要な時間を大幅に短縮することができる。

Step 11: Collect, compare, and select for retrieval

2人の独立したレビュアーがスクリーニングした文献を収集し、比較する。ステップ10で述べたソフトウェアツールは、すべて比較機能を備えており、筆者の以前の研究で述べた方法は、EndNoteでこれを実行する方法を説明している。両方のレビュアーがレビューに含めるよう選択した重複する文献のセットは、次のステップである全文検索のために考慮される。重複していない文献のうち、レビュアーの意見が一致しなかったものについては、2人の間でディスカッションを行い、共通の最終決定を下す。意見の不一致が続く場合は、独立した第3のレビュアーを配置する(図2)。あるいは、2人のレビュアーのうち少なくとも1人が次のステップで検討する文献を決定することもできる。通常、3人目の査読者は、そのテーマについて経験のある上級研究者であるべきである。

図2。

Step 12: Retrive full text and apply selection criteria

タイトルと抄録に基づいて選択した文献の全文を検索する。全文は通常、EndNoteの「全文検索オプション」を使うか、最寄りの図書館やGoogle ScholarやResearch Gateなどのオンライン検索エンジンを検索するか、著者に直接問い合わせることで見つけることができる。文献の全文をレビュアーが直接入手できない場合、その文献を無視すべきではない。すべての全文が検索されたら、2人の独立したレビュアーが選択基準を用いて論文を選別し、システマティックレビューに含める論文を選択する。意見の相違を解決するために3人目の独立したレビュアーがいる。抄録のスクリーニングと同様に、Endnoteのカスタムグループは、除外する様々な理由を区別することができ、論文は特定のサブクエスチョンに対して特定のグループに割り当てることができる。

Step 13: Contac experts

その分野の専門家である著者に連絡を取り、進行中または欠落している研究を特定したり、未発表であるが関連するデータを見つけたり(例えば、あるアウトカムの推定値は論文で提供されているが、別のアウトカムの推定値は提供されていない場合がある)、メタアナリシスで全研究の推定値をより有意義に組み合わせるために、標準化された共変量セットを用いて、発表された研究から要約推定値の再計算を支援したりする。専門家を特定するには、ステップ12で選択した論文の著者と連絡を取ることを推奨する。これらの著者から提案された文献が、すでにレビューした文献と重複していないかどうかを確認し、重複していない場合は、ステップ9-13を繰り返して、提案された研究をレビューに含めるかどうかを最終決定する。

Step 14: Search for additional references

このステップでは、ステップ12の最後とステップ13で集めた文献を、その中で引用されている関連研究をレビューするか(前方検索)、論文を引用した研究をスクリーニングする(後方検索)。詳細については以下を参照。https://www.elsevier.com/__data/assets/pdf_file/0005/79196/scopus-quick-reference-guide.pdf このシステマティックレビューに関連する過去のシステマティックレビューの参考文献リストも検索する。これらの情報源から選択した文献については、EndNoteをScopusまたはWeb of Scienceデータベースと組み合わせて使用し、既存のEndNoteライブラリに半自動的にダウンロードすることができる。この場合も、ステップ8-12と同様に、文献のチェックと重複の排除、フルテキストの検索とスクリーニングを再度行う必要がある。

Step 15: Make the final selection list and draw the flow chart

ステップ12, 13, 14で選択された論文がレビューに含まれる最終論文となる。うまく設計されたフローチャートには、データベース検索、専門家、参考文献リストを通じて特定された関連する引用の数、タイトルと抄録検索に基づいて除外された研究の数、スクリーニングされた全文の数、全文評価後に除外された研究の数、各理由で除外された研究の数を引用した除外理由、システマティックレビューに含まれる研究の数に関する情報が含まれる。フローチャートの例はw9にある。

Step 16: Apply data collection frome (in pairs)

次のステップは、ステップ5であらかじめ定義された収集フォームを使用して、含まれる研究に含まれるデータを抽出することである。フォームの項目を用いて、2人の独立した査読者が各論文から詳細なデータを抽出する。データ抽出のプロセスに細心の注意を払うことで、エビデンスに共通する特徴を最初に理解し記述することができ、その後に続く統合の分析・解釈プロセスへの道が開かれる。データを抽出する際には、略語を明確にし、すべてのデータを同じ単位で慎重に変換し、一貫した定義を維持し、内容を簡潔にする。

Step 17: Evaluate study quality and risk of bias

エビデンスと結果は、含まれる研究の質に照らして解釈されるべきである。研究の質には、研究がどのように実施されたか(方法論的質)と、どのように記述されたか(報告の質と再現性)が含まれる。レビューに含まれる主要研究の方法論と報告の質が低いと、バイアスや偽の結論がもたらされる可能性がある。したがって、正確性と一般化可能性を保証するためには、2人の独立したレビュアーによる研究の質の正当な評価が不可欠である。方法論の質の重要な側面は、組み入れられた研究におけるバイアスのリスクである。研究者は可能な限り最善の研究を行ったかもしれないが、それでも交絡、選択バイアス、情報バイアスのリスクが高いかもしれない。対象研究のバイアスリスクを評価するのに役立つチェックリストが数多くある。コクラン共同計画のツールRoB 2Newcastle-Ottawa Scaleは、それぞれRCTと前向き観察研究におけるバイアスのリスクを評価するために最も一般的に使用されている。RoB 2ツール(オンラインサプリメントI)は、5つの可能性のあるバイアス源を評価する:ランドオム化プロセスから生じるバイアス、意図した介入からの逸脱によるバイアス、アウトカムデータの欠落によるバイアス、アウトカムの測定におけるバイアス、報告された結果の選択におけるバイアスがそれである。Newcastle-Ottawa Scale(オンラインサプリメントII)は、星印システム(星印は最大9つ)を用いて、3つの領域(参加者の選択、研究群の比較可能性、アウトカムと関心のある曝露の確認)を評価する。星が9個のスコアはバイアスのリスクが低いと判断され、星が7個または8個のスコアは中程度のリスク、6個以下はバイアスのリスクが高いと判断される。介入に関する非ランダム化研究(ROBINS-I)や、QUADAS-2(Quality Assessment of Diagnostic Accuracy Studies 2)のような診断精度に関する研究におけるバイアスのリスクを評価するために、別のツールが開発されている。さらに、QUIPS(Quality In Prognosis Studies)ツールは、予測因子探索(予後因子)研究におけるバイアスのリスクを評価するために開発された 。システマティックレビュー/メタアナリシスに含まれる研究のエビデンスの質は、読者が提供された結論にどの程度の信頼性を置くことができるかについての考えを提供するために、明確に報告、議論、解釈されるべきである。RCTの質をどのように評価するかについては、w10を参照されたい。

Step 18: Prepara database for analysis

このステップでは、新たに作成したデータベースのデータを列挙し、統計評価プログラム(SPSSまたはExcel)にインポートし、分析の準備をする。分析は、研究の特徴、所見、質に関する構造化された要約や考察のような記述的なもの(ステップ19)もあれば、統計的分析(ステップ21)を伴う定量的なもの(ステップ20)もある。データの質はレビューに含まれる研究に依存するw11では、研究の種類別の効果測定の概要と、データをプールするために使用するランダム効果モデルおよび固定効果モデルを提案している。例えば、観察研究では、有病率、平均差、\(\beta\)回帰係数、オッズ比、相対リスク、ハザード比が報告される。一方、臨床試験では、アウトカムが二値である場合、アウトカムのベースライン値と試験終了時の値を報告し、その平均値は含まれる研究間で調和される。例えば、極端な分位数(上位と下位の5分の1、3分の1など)、ベースライン暴露の単位当たりまたは標準偏差当たりの変化などを比較して、リスク推定値を報告する研究もある。また、アウトカムは異なる尺度で測定されることもある。血糖値については、英国ではmmol/Lが最も一般的な測定法であるのに対し、米国や欧州大陸ではmg/dLが主に用いられている。医療経済学的アウトカムのシステマティックレビューは、異なる年の異なる通貨で表示されることがあり、通貨換算やインフレの調整が必要である 。単位と通貨の変換を支援するオンラインツールがある。

Step 19: Conduct descriptive synthesis

記述的要約は、発見を要約し説明するために、主に言葉と文章に頼る。メタアナリシスを含めるかどうかにかかわらず、著者は検索戦略から見つけた文献の数、スクリーニングした抄録と全文の数、レビューに含めた最終的な主要研究の数を要約することで、システマティックレビューのプロセスの流れを記述する必要がある。このプロセスはフローチャート(w9)にまとめられている。著者はまた、対象とした研究の集団、曝露の種類、介入の詳細、アウトカムなどの特徴を表と原稿の本文に記述する。メタアナリシスが不可能な場合(ステップ20参照)、著者は、効果の方向性と大きさ、研究間の効果の一貫性、効果の証拠の強さなど、組み入れられた研究の結果を記述すべきである。Rodgersらはさらに詳しいガイダンスを提供している。研究特性を含む表の例をw12に示す。

Step 20: To meta-analyze or not

このステップの前に、システマティックレビューとメタアナリシスは同じステップを共有している。ステップ20で、研究チームは各アウトカムについて収集したデータが定量的手法によるプーリングに適しているかどうかを決定しなければならない。 異なる研究のデータを組み合わせることで、サンプルサイズが大きくなり、統計的検出力が増し、効果の大きさの推定が向上する。また、可能であれば、メタアナリシスにより、(各研究の所見を個別に記述する代わりに)所見のプール効果を記述することが容易になる。プールするかどうかの決定は、異質性の程度に依存する。異質性は無視すべき条件ではなく、報告すべき条件であり、複数のレベルで起こりうる。デザイン(介入か観察か)の違いなどの研究特性、年齢、性別、地理的位置の違いなどの集団特性、分析、調整、関連尺度の違いを含む方法と結果が異質性の例である。臨床的、生物学的、または方法論的異質性は、特定のトピックに特有かもしれないが、統計的異質性は、すべてのメタアナリシスで同じ統計的手法を用いて調べることができる 。統計的異質性を評価する最も一般的な方法には、コクランの\({\chi}^2\)乗検定(コクランのQ)があり、これはすべての研究が同じ効果を評価しているという帰無仮説を検討するものであるが、必ずしも異質性を正確に検出できるとは限らない。Higginsの\(I^2\)統計量も広く使われている。Higginsの\(I^2\)は、標本推定値間のばらつきのうち、サンプリングエラーではなく異質性に起因するものの割合を表す(研究間のばらつき全体のうち、偶然を超えたものがどれくらいの割合を占めるかを示す)。\(I^2\)値は0~100%の値をとることができ、100%が異質性の最大レベルである。多くの場合、\(I^2\)値が25%未満は低異質性、25~50%は中程度、75%以上は高異質性とみなされる。 \(I^2\)は、すべてのコクラン・レビューや医学雑誌に掲載されたメタアナリシスで日常的に実施されている。しかし、\(I^2\)には不確実性があり、HigginsとThompsonはこの不確実性を計算する方法を提供し、最近、他の研究者は、\(I^2\)は研究数が少ないと統計的検出力が低く、その95%信頼区間が大きくなる可能性があると指摘しており 、\(I^2\)が正確でないことを考えると、95%信頼区間を常に与えるべきである 。例えば、STATAでは、検定に基づくアプローチと非心\({\chi}^2\)に基づくアプローチ(heterogiモジュール)の2つの方法のいずれかを用いて95%信頼区間を計算することが可能である。これら2つの手法の性能は同等であるが、検定に基づくアプローチは下限信頼区間と上限信頼区間についてより低い値を与えることが多いので、非心\({\chi}^2\)ベースのアプローチの方が望ましいかもしれない。統計的異質性の認識は、異なる研究を組み合わせるのに十分なほどデータが類似しているかどうかの研究者の決定に影響を与える可能性がある。したがって、メタアナリシスで治療推定値をプールするかどうかを決定する場合、Rueckerらは、\(I^2\)ではなく、研究間分散(\({\tau}^2\))がこの目的のために適切な指標である可能性があることを示唆している。メタアナリシスにおける研究は、研究間の定義、コード化、方法、比較、暴露のカテゴリーが比較可能であることが重要である。したがって、推定値を統合する前に、可能であれば同じ推定値を使用し、コーディングと定義を標準化することが重要である。メタアナリシスのためにデータを標準化する際に、どのような潜在的な問題があり、どのように対処するかについての詳細は、w13に記載されている。

研究者が直面するもう一つの疑問は、同じ研究課題に取り組む異なるタイプの研究(観察研究とRCT、観察研究と実験研究など)を統合するかどうかである。複数の研究デザインを含めることで、システマティックレビューの質が大幅に向上し、よりよい理解、所見の解釈のしやすさ、矛盾する結果の明確化に貢献する可能性がある。健康介入を研究する際のもう一つの重要な不確実性は、RCTのみを含めるか、非ランダム化も含めるかということである。RCTはエビデンスの質ピラミッドの最上位に位置すると考えられているが、Ioannidisらは、前向きデザインを用いた非ランダム化研究のみを考慮した場合、RCTと非ランダム化研究間の不一致はより少なかったと報告している。また、Cochrane Collaborationは、非ランダム化研究を含めるためのガイドを提供しており 、RCTと対照非ランダム化研究のバイアスリスクを評価するツールを開発している。したがって、特に無作為化が倫理的に重要な問題を引き起こす可能性がある場合には、非ランダム化研究を軽視しないことが重要である。さらに、臨床では1つの健康状態に対して2つ以上の介入に関心があり、研究者はしばしば、関連するすべてのRCTの単一で首尾一貫した分析において、利用可能な最善の介入を決定することを目的としている。ペアワイズメタ解析(pairwise meta-analysis)とその拡張であるネットワークメタ解析(network meta-analysis:NMA)は、head-to-head研究で研究されていない複数の介入を間接的に比較することを容易にするために開発された。ネットワークメタ解析は、ペアワイズメタ解析と比較して、より多くのエビデンスの可視化、すべての介入間の相対効果の推定、介入の順位付けを可能にする。NMAの基本的な前提は、メタアナリシスに含まれる他の治療と比較して、各治療の相対的治療効果を変更するような研究または個人の特性は存在しないということである。NMAは、適切な尺度(平均差、オッズ比、ハザード比、相対リスク)を用いて、連続的および二項対立的なRCTの結果だけでなく、イベント率や生存モデルからも実施できる。NMAの実施方法の詳細については、他の文献を参照されたい。

例:筆者らは、植物性窒素摂取と2型糖尿病(T2D)リスクおよびグルコースホメオスタシスとの関連を研究した。観察的縦断研究とRCTを対象とした。観察研究(T2D発症リスク)とRCT(平均血清変化)で報告された推定値はプールすることはできないが、相補的である。特に、T2Dリスクに対する植物性エストロゲンの有益な効果に関する知見は、植物性エストロゲンの補充がグルコースホメオスタシスを改善することを見出したRCTからの知見で支持された。したがって、筆者らのレビューの結論は、観察研究のみ、またはRCTのみを対象とした場合よりも強力であった。同様に、アルコール摂取と閉経の発症に関する別の系統的レビューとメタアナリシスでは、横断的研究と縦断的研究のメタアナリシスの結果が同様の結論を示し、横断的研究のみを選択していた場合の知見の妥当性が強化された 。エビデンスを統合する際、著者はしばしば2つの統計的手法、すなわち固定効果(FE)モデルとランダム効果(RE)モデルのどちらかを選択する必要がある。これら2つの方法は、類似した結果をもたらすこともあれば、食い違った結果をもたらすこともある。しかし、2つのモデルの結果が類似していたとしても、要約推定値は異なる方法で解釈されるべきである 。FEモデルの基本的な仮定は、観察対象の曝露効果または治療効果がメタ分析に含まれるすべての研究で固定されていることであり、REモデルは曝露効果が研究間で変化することを許容している。簡単に言えば、REモデルは研究の根底にある真の効果が異なることを許容し、その結果、研究間の説明できない異質性を説明する。主な誤解は、異質性の検定に基づいてモデルを選択すべきであるというものである。実際、異質性の分散が0%と推定される場合、2つのメタ解析モデルの結果は同じになることが多い。しかし、異質性が検定で検出されなくても存在する可能性があるので、異質性の検定に基づいてモデルを選択すべきではない。図3では、FEモデルとREモデルを比較し、解析に適したモデルを選択する方法を示している。

最後に、様々なソフトウェアアプリケーションがメタアナリシスを実行できる。しかし、最も一般的に使用され、経験の浅い研究者にとっては、おそらくメタ分析のための最も簡単な方法の1つは、STATAのmetanコマンドである。著者がSTATAのサブスクリプションを持っていない場合、メタ分析パッケージは、オープンアクセス統計環境であるR(Metafor(Rパッケージ))で利用可能である。Rを使用した経験がないユーザーには、Rパッケージを使用して統計解析テストを実行するために使用される無料のオープンソースプログラムであるJASPまたはJamoviを推奨する。さらに、Cochrane Collaborationによって開発されたReview Manager (RevMan)は、メタアナリシスの世界に慣れていない人には良い選択かもしれない。とはいえ、簡単なメタ分析を行うには、MetaEasyやMetaXLのようなExcelアドオンを使用することも可能である。

Step 21: Exploration of heterogeneity

サブグループ解析(層別化)は、一次目的と二次目的の定義の中で、ステップ1から考慮すべきである。結果が異なる可能性のある因子-すなわち効果修飾因子-には、研究デザイン、地理的位置、発表日、介入の種類などの研究特性や、年齢、性別、民族性、疾患の有無などの集団特性が含まれることが多い。プールされた推定値が群内で異なるかどうか、また\({\tau}^2\)が変化するかどうかを比較するために、これらの因子の異なるカテゴリーごとに結果を示し、プールすべきである。特定の層内での異質性も評価すべきである。メタ回帰分析は、観察された異質性が特定の研究または集団の特性の結果であるかどうかを調べるためにも使用できる。したがって、メタ回帰は、結果変数に対する1つの因子の効果を決定するために使用される従来の統計的回帰に類似している。メタ回帰は、10以上の研究がメタ分析に含まれる場合によく行われる。サブグループ分析の例はw14にある。システマティックレビューにおけるサブグループ解析の解釈に関する推奨は、ここでは掲載しない。

Step 22: Check reporting bias

出版バイアスは、出版された文献がすべての完了した研究を組織的に代表していない場合に発生する。出版バイアスは、実験や研究の結果に影響されて出版を決定することに起因する。最も一般的なのは、否定的な結果や有意でないと判断された結果は、投稿されにくく、論文として受理されにくいということである。出版バイアスは通常、非対称性を視覚的に評価できるファネルプロットや、エッガーテストを用いて評価される。ファネルプロットとは、研究の精度の尺度(一般的に標準誤差)に対する個々の研究からの暴露効果推定値の散布図である。漏斗が非対称である場合、文献から欠落している研究があることを示唆している可能性がある。しかし、出版バイアスはファネルプロット非対称性の唯一の原因ではなく、バイアスの他の原因には異質性、選択的結果報告、単なる偶然が含まれる。特に研究数が少ない場合、ファネルプロットでは出版バイアスを検出できないことがある。Harbordは、バイナリーエンドポイントを持つ対照試験のメタアナリシスにおける小規模研究効果のためのEgger検定の修正版を開発した 。しかし、この検定は、グループサイズに大きな不均衡があるコホート研究のメタアナリシスでは推奨されない。さらにBeggは、Kendallの方法(分散と効果量の相互依存性の検定)を用いたバイアス指標を提案した。このバイアス指標は、Eggerよりも仮定が少なく、研究数が少ない場合、検定が有意でないとバイアスを除外できない。しかしこの検定は、ファネルプロットグラフを補完する正式な手順として、メタアナリシスの探索的ツールとして使用することができる。試験間の異質性の程度が大きい場合、言及した3つの検定はいずれも一様に優れた特性を持たない。最後に、出版バイアスが存在する場合は、報告と徹底的な議論が必要であるが、研究の公表を妨げる必要はない。より詳しい情報はw15を参照。

Step 23: Check the quality of the evidene: the confidence in the results presented

システマティックレビューとメタアナリシスで報告される結果の強さは、第一にレビューのエビデンスの質に依存する。著者は、GRADE(Grading of Rec-ommendations Assessment, Development and Evalua-tion)アプローチを適用して、システマティックレビューに含まれるエビデンスの質をスコア化することができる。GRADEアプローチは、効果の大きさ、バイアスのリスク、研究デザイン、所見の一貫性と直接性を考慮して、エビデンスの質を判断する。GRADEでは、エビデンスを高、中、低、非常に低に分類する。RCTは質が高く、観察研究は質が低い。研究の質の限界、結果の重要な矛盾、またはエビデンスの直接性に関する不確実性は、エビデンスの等級を下げる可能性がある。また、用量反応勾配の証拠や、もっともらしい交絡因子がない2つ以上の観察研究からの一貫した証拠に基づく強い関連性の証拠など、特定の要因によってグレードが上がることがある 。評価は、2人のレビュワーが独立して行い、意見の相違があれば、独立した3人目のレビュワーと協議する。GRADE手法の詳細な使用方法は、以下のオンラインチュートリアルに記載されている。https://gdt.gradepro.org/app/handbook/handbook.html

Step 24: Update, report, and submit for publication

出版に向けて研究を提出する準備ができたら、書誌データベースの検索を開始してからの間隔が6-12か月を超える場合は、最近出版された論文を特定するために検索を更新すべきである。透明性、再現性、研究間の比較可能性を促進するために、系統的レビューとメタ分析の報告方法に関するガイドラインが存在する。PRISMAQUOROM(PRISMAに発展)、MOOSEは、システマティックレビューとメタアナリシスの報告順序を図式化したフローチャートである。研究を投稿する際には、詳細なPRISMAまたはMOOSE報告書を添付することが必須である。PRISMAとMOOSEのフローチャートは、オンラインの補足資料IIIとIVに掲載されている。最後に、内容に精通した専門家に査読とコメントを依頼することができる(出版された論文では、彼らの助力を認めるべきである)。最後にもう一度、結果の解釈を評価することで、出版物の質をさらに向上させることは可能である。

最後に

エビデンスの統合は、科学的出版物や学術雑誌が氾濫する現代において、エビデンスに基づく医療や政策立案のための不可欠なツールである。医療従事者や研究者は、このようなレビューの作成原則を理解し、効果的に使用するために厳格なプロトコールに従わなければならない。この24ステップのガイドは、システマティックレビューの実施プロセスを簡略化し、医療専門家や研究者に方法論的に健全なシステマティックレビューやメタアナリシスを実施するためのツールを提供し、すでに実施されている統合作業の質を高めることができる。本書は、システマティック・レビューの複雑なプロセスとその質に対する読者の理解を深め、臨床上の意思決定や政策決定への知識統合の導入を促進するものである。

関連記事

ブロックランダム化とはなにか
そもそもマルチレベル分析とはなにか

コメント

タイトルとURLをコピーしました