Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

第 3 回:研究仮説の立て方と Directed Acyclic Graph(疫学各論 2)

臨床医のための疫学シリーズ: 地域中核病院で行う臨床研究

第3回 研究仮説の立て方とDirected Acyclic Graph(疫学各論2)

小松 裕和 a) b) 鈴木 越治 b) 土居 弘幸 b)

要 旨 説が最も重要であると言っても過言ではない。臨床
現場の経験から導き出される「ある種の感覚」や「問
「研究仮説」
の善し悪しが臨床研究の質を決めると
い」
,これらの漠然としたものを如何に研究で検証で
言っても過言ではない。しかし,研究仮説の立て
きる形に落とし込み,臨床現場に意味あるものとし
方,洗練の仕方について記載した文献は少なく,
多くの臨床医は不十分な研究仮説をもとに臨床研 て洗練することができるのかが重要である。しかし,
究を行っている。研究仮説を立てるにあたっては, 研究仮説の立て方,洗練の仕方について記載した文
対象者・曝露(介入)
・コントロール・結果をきち 献は少なく,多くの臨床医は不十分な研究仮説をも
んと定義し,反事実モデルをもとに十分に検討と
とに臨床研究を行っている。
議論を重ねていくことが何よりも重要である。そ
一方で,研究仮説を検討するにあたり,近年では
の上で,近年疫学分野で用いられるようになって
いる Directed Acyclic Graph(DAG)をもとに,研 疫学分野において Directed Acyclic Graph(DAG)と
究計画や解析計画を立てること,調整が必要な交 呼ばれるツールが用いられるようになってきている
絡要因について検討することが重要である。DAG (通常,ダグと発音している)1, 2)。このツールはグラ
は簡単な規則をいくつか理解してしまえば非常に
フ理論を背景に因果関係を視覚的に表すものであり,
有用なツールであり,臨床研究を行う際にも,論
研究仮説の明確化,交絡要因の検討,多変量解析モ
文を読む際にも役に立つものである。
(日救急医会誌 2009;20:397-403) デルの構築・結果の解釈に用いられるようになって
キーワード:研究仮説,反事実モデル,Directed いる。いくつかの基本的事項を理解すれば,臨床研
Acyclic Graph 究を実施するにあたっても,論文を読むにあたって
も非常に便利なツールとなる。

✚ 研究仮説の立て方 ✚
臨床研究を行うにあたり研究仮説を立てることは,
簡単なようで非常に難しい。大規模研究においても 1. 研究仮説を定義する
研究仮説の善し悪しが研究の質を決めるものである 研究仮説を立てるにあたっての基本は,臨床現場
が,地域中核病院で行う臨床研究においては研究仮 で思い抱いている感覚を適切に言葉で表現すること
から始まる。連載第 2 回 3) でも紹介したように研究
仮説は PE(I)CO で表現できる形にしなければならな
a)JA 長野厚生連佐久総合病院地域ケア科
b)岡山大学大学院医歯薬学総合研究科疫学・衛生学分野 い。「対象者(patient)」「曝露(exposure)/ 介入

日救急医会誌 2009;20:397-403 397


臨床医のための疫学シリーズ

ドクターヘリで搬送された患者は予後がよい A 地域における 20-64 歳の外傷患者

PE
(I)
CO に従って臨床研究で 同じ外傷患者群が…
検証できる形に定義する

ドクターヘリ搬送 救急車搬送
対象者(P) A 地域における 20-64 歳の外傷患者
曝露(E) ドクターヘリ搬送
コントロール(C) 救急車搬送
事実 反事実
アウトカム(O) 入院後 30 日間の生存
これを比較することがゴールドスタンダード
図 1.研究仮説を定義する
図 2.反事実モデル(counterfactual model)

(intervention)」
「コントロール(control)」
「アウトカ なる考えが存在する。この考えは「反事実モデル
ム(outcome)」をどのように定義するのかが重要で (counterfactual model)
」と呼ばれる臨床では聞きなれ
ある。 ない言葉であるが,日常的に多くの人がよく使う考
例えば,
「ドクターヘリで搬送された患者は予後が え方であり理解は難しくない。例えば,A さんが腰
よい」ということを検証したい場合は以下のように 痛で NSAIDs を処方され内服していたところ 1 週間
なる。対象者としては,全患者で行う場合や疾患群 後に胃潰瘍で吐血したとしよう(これを事実と呼
や年齢層を絞る場合があるが,ここでは「A 地域に ぶ)
。このとき,
「AさんがNSAIDsを内服しなければ
おける20-64歳の外傷患者」としてみよう。次に曝露 どうなっていただろう?」
,これが反事実モデルの考
としては,「ドクターヘリによる搬送」
,コントロー え方である。この事例では A さんは NSAIDs を内服
ルとしては「救急車による搬送」と比較的明確に定 しなければ胃潰瘍にならなかったかもしれないし,
義できる。最後にアウトカムとしては,「予後がよ たとえ NSAIDs を内服しなくてもストレスが多い場
い」ということを明確にしなければならない。ここ 合には胃潰瘍になったかもしれない(これらを反事
では「入院後 30 日間の生存」としてみよう。このよ 実と呼ぶ)

うなステップを経て,研究仮説は「A 地域における 実は,コントロール群としてのゴールドスタン
20-64歳の外傷患者において(P),ドクターヘリで搬 ダードこそがこの反事実なのであり,「事実」と「反
送された患者(E)は,救急車で搬送された患者(C) 事実」を比較することを臨床研究では目指さなけれ
と比べて,入院後 30 日間の生存(O)がよい」と定 ばならない。しかし,ここで重要なのは,上記の事
義することができる(図 1)。 例のように「事実」として観察されるものは 1 つし
かなく,それ以外の「反事実」は観察することがで
2. 反事実モデル きないということである。そのため,コントロール
上記のようなステップで研究仮説の明確化と定義 群の選択にあたり,いかにゴールドスタンダードと
を行っていくのだが,連載第 1 回 4) でも紹介したよ しての「反事実」に近づけた形でコントロール群を
うにコントロール群の選択が臨床研究の質を決める 選択するかということがポイントになるのである
ことが多い。コントロール群の選択こそ疫学者の腕 (図 2)。
の見せ所であるが,決してこれは「ある種の感」で 上記で挙げたドクターヘリ搬送の事例では,A 地
コントロール群を選択しているわけではなく基本と 域における 20-64 歳の外傷患者のうちドクターヘリ

398 JJAAM 2009;20:397-403


第 3 回:研究仮説の立て方と Directed Acyclic Graph(疫学各論 2)

で搬送された患者が,
「もしドクターヘリ搬送されな
✚ Directed Acyclic Graph(DAG) ✚
かった場合(救急車搬送された場合)」,入院後30日
間の生存に差があるかを考えることになる。また, こちらも臨床では耳慣れない言葉であるが,要す
臨床研究において重要な考え方は,集団同士を比較 るに研究仮説を「因果関係」を示す矢印によって分
することによって初めて曝露の影響は推定できると かりやすく表すツールである。このツールの強力な
いうことである。ここで,
「事実」
としてドクターヘ 点は,ただ矢印を書き加えながら研究仮説を明確に
リ搬送された外傷患者群のアウトカムは観察できる するだけで,グラフィカル理論に基づき交絡要因の
が,同じ外傷患者群が「反事実」としてドクターヘ 判断が容易にできる点である。数式の理解は全く必
リ搬送されなかったアウトカム(救急搬送されたア 要なく,検定や統計解析ソフトも必要ない。ただ単
ウトカム)は観察することができない。そこで,「基 に矢印をある一定の規則に従って書き加えていけば
本属性が同じような外傷患者群」でドクターヘリ搬 よいのである。DAGによって,それぞれの研究者が
送されなかったもの(救急搬送されたもの)をコン 考える研究仮説や交絡要因についても視覚的に分か
トロール群として集めてくることが必要となる。 りやすくなり,研究計画やデータ解析を洗練された
例えば,無作為化比較試験(randomized controlled ものとして,それらを踏まえたディスカッションも
trial: RCT)のように外傷患者が発生した時点でドク 飛躍的に進むようになる。また,交絡要因の選択に
ターヘリ搬送(曝露群)と救急車搬送(コントロー あたってしばしば陥りやすい誤りを避けることもで
ル群)に無作為に割り付ける場合,統計理論上は「コ きるようになる。
ントロール群=反事実」となる。また,RCT も含め 一定の規則としては,① 1 方向性の矢印のみを用
た多くの論文において,曝露群とコントロール群の い,双方向性の矢印は用いないこと,これが
基本属性を比較する表がある(単変量解析による p 「Directed:方向性を持った」という意味である。ま
値が示されていることも多い)が,これは「コント た,②矢印を順に辿っていっても出発点に戻らない
ロール群が反事実とどの程度違いがあるか」をみて こと,このため矢印がグルグルと循環しない。これ
いるものである。そして,基本属性に違いがある場 が「Acyclic:循環しない」という意味である。そし
合は多変量解析で交絡要因の調整を行うことになる て,基本的な用語としては,矢印の前にあるものを
が,これは多変量解析による交絡要因の調整によっ 「原因(または親)
」,矢印の後ろにあるものを「結果
て「コントロール群=反事実」となるという前提に (または子)
」と呼ぶ。
基づいているのである。 例えば,先程のドクターヘリ搬送の例では,
「ドク
このように反事実モデルという耳慣れない言葉で ターヘリ搬送」→「30 日間の生存」という矢印が引
はあるが,臨床研究を計画するにあたっては非常に け,「ドクターヘリ搬送」
を「原因」
,「30日間の生存」
重要な考え方であり,一旦理解してしまえば問題な を「結果」と呼ぶ。
く多くの臨床医が使えるようになるものなのである。
なお,本稿で示した「研究仮説の立て方」に関する 1. DAG の解釈に必要な 3 つのパターン
詳細な疫学的解説について,興味のある読者は参考 DAGの解釈に当たっては 3 つの重要なパターンを
5)
文献 を参照いただきたい。 理解しておくことが必要である。 1 つ目は,
「A→B
→C」
というパターンであり,
「因果連鎖」
を表すDAG
である(図 3)。このとき,A が B に影響を与え,さ
らにCに影響を与えることを示している。そして,
「A

日救急医会誌 2009;20:397-403 399


臨床医のための疫学シリーズ

A B C B B
「A と B」「A と C」「B と C」は
統計学的に関連がある,従属である
A C A C
A B C
「A と C」は 「A と C」の関係は
B で調整を行う(多変量解析や層別分析など)と, 因果関係がなくても 共通原因 B を
「A と C」は統計学的に関連がない,独立である 統計学的には 調整して
関連している 初めて分かる
図 3.DAG のパターン 1:因果連鎖
DAG においてはこのように
共通原因となるものを交絡要因と定義する

図 4.DAG のパターン 2:共通原因


と B」
「A と C」
「Bと C」はグラフィカル理論から「統
計学的に関連がある,従属である」
と解釈できる。ま
た,中間要因の B で調整を行う(多変量解析や層別 にも影響を与えることを示している。矢印のつな
分析など)と,「A と Cは統計学的に関連がない,独 がっている「A と B」
「B と C」は「統計学的に関連
立である」と解釈できる(注)。 がある,従属である」と解釈でき,また B が増加す
先程のドクターヘリ搬送の事例では,
「ドクターヘ る(減少する)と A も C も増加する(減少する)こ
リ搬送では搬送時間が短く,30 日間の生存がよい」 とから「A と C」も「統計学的に関連がある,従属で
というメカニズムが考えられるため,
「ドクターヘリ ある」と解釈できる。つまり,
「A と C」に因果関係
搬送」→「搬送時間」→「30日間の生存」というDAG の矢印がなくても,A と C に矢印を出す B が存在す
となる。ここで,
「搬送時間」
で調整を行ってしまう ることにより,A と C が見掛け上は関連しているこ
と,
「ドクターヘリ搬送」と「30 日間の生存」の関連 ととなる(もしくは,
「A と C」に因果関係の矢印が
はみられなくなってしまう。つまり,このような場 あっても,B によってその関係が修飾されてしま
合,「搬送時間」
を交絡要因と考えて統計学的に調整 う)。このように,「AとC」の関連を考える際,Aと
してしまうことは,「ドクターヘリ搬送」と「30日間 Cの共通原因になっているBをDAG では交絡要因と
の生存」の関連を検証するにあたって誤りであるこ 定義できる。そして,A と C の共通原因である B で
とが分かる。なお,統計学的手法による調整を行う 調整を行うと初めて「AとC」の関係は統計学的に独
際に,
「中間要因を交絡要因として調整してはいけな 立となり,Bのもたらす交絡の影響を調整した上で,
い」と一般的に指摘されている理由は,このような 「A と C」の真の関係を検証することが可能となるの
DAG の解釈からも理解できる。 である。
ではどのような場合なら交絡要因として調整して 先程の事例で考えると,「ドクターヘリ搬送(A)」
もよいのだろうか?これを理解するのに必要なのが と「30 日間の生存(C)」の共通原因となるものとし
2 つ目のパターン「A ← B → C」であり,
「共通原因」 て「injury severity score(ISS):外傷の重症度(B)」
を表す DAG である(図 4)。これは,B は A と C の が挙げられる。ISS が高ければドクターヘリ搬送さ
共通原因であるので,Aに影響を与えると同時に,C れやすく,30日間の生存も少なくなることが予想さ

注:グラフィカル理論から統計学的な解釈を与えるためには, 3 つの前提(causal markov assumption(CMA),faithfulness,negli-


gible randomness)が必要である。それぞれの詳細については,参考文献 6) を参照。

400 JJAAM 2009;20:397-403


第 3 回:研究仮説の立て方と Directed Acyclic Graph(疫学各論 2)

A C A C 年齢

ISS: 重症度
合併症
B B
ドクターヘリ搬送 搬送時間 30 日後の生存
「A と C」の間には 「A と C」の間には
統計学的な関連はない 共通原因 B を 交絡要因としては,
調整すると ・ ISS だけを調整してもよいし,
偽の関連が生じる ・年齢と合併症を加えて調整してもよい
・搬送時間は調整しない
DAG においてはこのような共通結果
を調整することによって生じるバイアスを 図 6.DAG を用いた交絡要因の選択例
選択バイアスと定義する

図 5.DAG のパターン 3:共通結果


ほどきちんと受診するためフォローアップがしやす
いかもしれない。この場合,フォローアップできな
れるし,ISS が低ければドクターヘリ搬送されにく い脱落ケースが多くなると,フォローアップできた
く,30日間の生存も高くなることが予想される。つ グループにおいては,新しい治療(A)を受けている
まり,交絡要因であるISSを調整しなければ,
「ドク か,副作用が発生(C)するからかのどちらかの傾向
ターヘリ搬送(A)」の及ぼす「30 日間の生存(C)」 が強くなってしまう。つまり,新しい治療(A)を受
への真の影響は推定できないことが理解できる。 けているケースでは,副作用が発生(C)しにくく,
3 つ目は,「A → B ← C」というパターンであり, 新しい治療(A)を受けていないケースでは,副作用
「共通結果」を表す DAG である(図 5)。この DAG に が発生(C)しやすいという偽の関連が,脱落ケース
おいては,B が A と C の共通結果となっており,グ による選択バイアスのため生じるのである。
ラフィカル理論から矢印のつながっている「A と B」
「BとC」は「統計学的に関連がある,従属である」と 2. DAG を用いた交絡要因の選択についての検討
解釈でき,「A と C」は何も調整しない状態では「統 先述した 3 つのパターンをもとに,交絡要因の選
計学的に関連がない,独立である」
と解釈できる。そ 択について検討してみよう。ここでは以下に示すよ
して,B のように複数の矢印が集まる要因を矢印が うに DAG の構築を行う。①「ドクターヘリ搬送」は
衝突するイメージから合流点(collider)とも呼んで 「搬送時間」
が短いため,「30日間の生存」
がよい。②
いる。そして,3 つ目の「共通結果」を表す DAG が 「ISS:重症度」が高いケースほど「ドクターヘリ搬
重要である理由は,B のような共通結果となる合流 送」されやすい。③「ISS:重症度」が高いケースほ
点を交絡因子として調整した場合,本来は関連のな ど「合併症」も起こして「30日間の生存」が悪い,④
い A と C の間に偽の関連を生じてしまう点である。 「年齢」が高いほど「合併症」を起こしやすいし,「30
例えば,十分なフォローアップができていないこ 日間の生存」も悪い。⑤「年齢」と「ISS」とは関連
とによる選択バイアスはよい例である。新しい治療 がないとする(図 6)。
(A)とその副作用の発生(C)について検討する観 このようなDAGにおいては,
「ドクターヘリ搬送」
察研究において,新しい治療(A)を受けているケー と「30日間の生存」を検討するにあたって,「搬送時
スほど医師が受診を頻回にさせるためにフォロー 間」は中間要因であるため交絡要因として選択する
アップしやすく(B),また副作用の発生(C)ケース 必要がないことが理解できる。また,「ISS」は「ド

日救急医会誌 2009;20:397-403 401


臨床医のための疫学シリーズ

クターヘリ搬送」と「30 日間の生存」の共通原因と な解説を行った。次回は,臨床研究を行う上で重要


なっているため交絡要因として調整が必要であるこ となるバイアスについての考え方と,結果の解釈の
とが分かる。一方,「合併症」は「ISS」と「30 日間 仕方について紹介を行う。
の生存」の中間要因であるとともに,「合併症」は
「ISS」と「年齢」の共通結果でもある。今回の DAG 第 4 回:バイアスの考え方,結果の解釈の仕方(疫
においては,基本的に「合併症」について交絡要因 学各論 3)
として調整する必要はないのであるが,もし「合併 第 5 回:臨床研究における統計学の役割(疫学各論
症」だけを調整してしまった場合,共通結果で調整 4)
を行うことにより「ISS」と「年齢」の間に偽の関連
が生じてしまう。このため,
「合併症」
に加えて
「ISS」 参考文献
や「年齢」も同時に調整することが必要となる。こ
1) Glymour MM, Greenland S: Causal Diagrams. In: Rothman
のように,今回の単純化したDAGにおいても,交絡 KJ, Greenland S, Lash TL, eds. Modern Epidemiology. 3rd
要因の選択として複数の選択肢が存在することが理 edition. Lippincott Williams & Wilkins, Philadelphia, 2008:
183-209.
解できるであろう。交絡要因の調整に関しては,必 2) Glymour MM: Using causal diagrams to understand com-
ずしも唯一の選択肢があるわけではなく,各変数の mon problems in social epidemiology. In: Oakes JM, Kaufman
JS, eds. Methods in Social Epidemiology. Jossey-Bass, San
測定誤差,測定にかかる費用等を考慮に入れて,調
Francisco, 2006: 393-428.
整すべき交絡要因を選択するのである。 3) 小松裕和,鈴木越治,土居弘幸:臨床医のための疫学シ
なお,本稿で示した「Directed Acyclic Graph」に関 リーズ:地域中核病院で行う臨床研究 第2回疫学用語
の確認と論文の読み方(疫学各論 1).日救急医会誌
する詳細について,興味のある読者は参考文献 6) を
2009; 20: 338-44.
参照いただきたい。 4) 小松裕和,鈴木越治,土居弘幸:臨床医のための疫学シ
リーズ:地域中核病院で行う臨床研究 第 1 回臨床研究
における疫学と統計学(疫学総論).日救急医会誌
2009; 20: 288-93.
今後の予定
5) 鈴木越治,小松裕和,頼藤貴志,山本英二,土居弘幸,
津田敏秀:医学における因果推論 第一部研究と実践で
本稿では,研究仮説を考える際の基本的な考えで
の議論を明瞭にするための反事実モデル.日衛誌
ある反事実モデルについて解説を行った。加えて, 2009; 64: (in press).
研究仮説を洗練したものとして,結果のよりよい解 6) 鈴木越治,小松裕和,頼藤貴志,山本英二,土居弘幸,
津田敏秀:医学における因果推論 第二部交絡要因の選
釈を与え,研究者間でのディスカッションを促進す 択とバイアスの整理および仮説の具体化に役立つ Di-
るツールとして注目されているDAGについても簡単 rected Acyclic Graph.日衛誌 2009; 64 (in press).

402 JJAAM 2009;20:397-403


第 3 回:研究仮説の立て方と Directed Acyclic Graph(疫学各論 2)

ABSTRACT

Short Sminars on Epidemiology for Clinician

Clinical Research Based on Community Hospitals


Lesson 3: How to Construct Research Hypotheses, and Directed Acyclic Graphs

Hirokazu Komatsu a, b, Etsuji Suzuki b, Hiroyuki Doi b

a
Division of Community Care, Saku Central Hospital,
Nagano Prefectural Federation of Agricultural Cooperatives for Health and Welfare
b
Department of Epidemiology, Okayama University Graduate School of Medicine,
Dentistry and Pharmaceutical Sciences

It is no exaggeration to say that the appropriateness of “research hypotheses” governs the quality of clinical studies.
However, few papers in the published literature describe how to set up research hypotheses and how to refine them, and
many clinicians conduct clinical studies based on inadequate hypotheses. When setting up a research hypothesis, it is
most important to properly define the subjects, exposure (intervention), controls, and results, and to repeatedly engage
in discussions and debates based on counterfactual models. It is also important to establish a research plan and analysis
plan based on direct acyclic graphs (DAGs), which in recent years have come to be used in the field of epidemiology,
and to assess confounding factors that require adjustment. If several simple rules are thoroughly understood, DAGs are
very useful tools, and they are useful both when conducting clinical studies and when reading papers.
(JJAAM 2009; 20: 397-403)
Key words: research hypothesis, counterfactual model, directed acyclic graph

日救急医会誌 2009;20:397-403 403

You might also like