「ヒューマン&エコノに学ぶ、研究用語・統計用語」は、論文解説記事を読んでいて「ん?」となった用語を、掛け合い形式で解きほぐすシリーズです。統計の授業を受けたことがない方を想定しています。この記事は掛け合いが主役です。
今回のお題は相関関係・因果関係・交絡。Wattsのマシュマロテスト追試の記事で「家庭環境を共変量に入れたら効果が縮んだ」と書いたアレの、もう一段下にある土台です。回帰分析の記事でアイスと水難事故の話にちらっと触れましたが、今回はそこをじっくり掘り下げます。「『相関は因果じゃない』ってよく聞くけど、じゃあ何がどう違うん?」という素朴な疑問に答える回です。
サマリとこの記事でわかること
相関関係は「2つのものが一緒に動いている」という観察。因果関係は「一方が原因で他方が結果」という構造。この2つを取り違えさせる最大の犯人が、裏に潜む第三者=交絡変数です。
- 相関関係と因果関係は何が違うのか──「一緒に動く」と「原因になる」の区別
- なぜ「見かけの相関」が生まれるのか──裏に潜む第三者(交絡変数)の正体
- 「共変量を入れる」はなぜ交絡対策になるのか──回帰分析と因果推論のつながり
- 「相関があるのに因果がない」の別パターン──逆の因果・ただの偶然
第1幕:「一緒に動く」と「原因になる」は違う
なあ、よう言うやん。「相関は因果じゃない」って。あれ何回聞いても腹落ちせんのよ。
ほな例から入ろか。「アイスの売上が増えた日は、水難事故も増える」。これ、データで見るときれいな右肩上がりの関係が出るんや。ほんなら、「アイスを食べると溺れやすくなる」って結論でええ?
それはアホな話やろ。暑い日はアイスも売れるし、海やプールに行く人も増えるだけや。
その直感、めちゃくちゃ正しい。で、その直感を統計の言葉に翻訳するとこうなる。「アイスの売上」と「水難事故」は確かに一緒に動いてる——これを「2つに関連がある」って言う。でも「アイスを食べたから溺れた」わけやない——こっちは「一方が原因で他方が結果」という構造がない。
おお。「一緒に動いてる」と「一方が原因で他方が結果」って、別物として切り分けるわけか。
そういうこっちゃ。で、この「一緒に動いてる」関係を相関関係、「一方が原因で他方が結果」という関係を因果関係と呼ぶ。図で描くと、相関は「A ↔ B」で、どっちも一緒に動いてるだけ。因果は「A → B」で、矢印の向きがある。
じゃあ、「相関は因果じゃない」っていう決まり文句は、「一緒に動いてるからって、一方がもう一方の原因とは限らんで」ってことやな。
その通り。ここが今日の一番大事なポイントや。「一緒に動いてる」ってことと「一方が他方の原因」ってことは、見てるだけでは区別がつかへん。だから慎重に切り分けなあかん。
📝 ここまでのおさらい
第2幕:裏にいる第三者——交絡変数の正体
では、アイスと水難事故の話に戻ります。相関はあるのに因果はない——この「ズレ」は、どこから来ているのでしょうか。
で、アイスと水難事故の場合、ほんとは何が起きてるん?
両方に影響してる「共通の原因」がおるんや。そう、「気温」やな。気温が上がる → アイスの売上が増える。気温が上がる → 海やプールに行く人が増えて水難事故も増える。アイスと水難事故のあいだに「見かけの」相関が出てるのは、気温が両方を同時に押し上げてるからや。
あー、気温っていう裏の第三者が、両方の糸を引いてるわけか。
その「裏の第三者」のことを、統計では交絡変数って呼ぶ。2つのあいだに因果っぽい関係が見えるけど、実は別の変数が両方に影響してるだけ——これが交絡の正体や。
交絡。字からして「絡まって混乱させるやつ」って感じやな。
まさにそれ。人を混乱させる犯人や。交絡変数を見逃すと、見かけの相関を「因果」と取り違えてしまう。
他にも交絡の例ある?
たとえば「朝食を食べる子は学力が高い」ってよう言われるやろ。これも「朝食が学力を上げてる」と言い切るのは危ない。
朝食をちゃんと用意できる家庭は、他のところでも子供に余裕をかけてるってことか。
そこや。家庭の経済状況や親の関わり方が裏の共通原因で、朝食と学力の両方に影響してる可能性がある。これも交絡の構造や。
じゃあさ、Wattsのマシュマロテストの記事の話も同じ構図やん?マシュマロで待てた子は将来の成績がいい——でも裏に「家庭環境」っていう共通原因がおった。
まさにそれ。あの記事で出てきた「共変量を入れたら効果が縮んだ」って話は、「疑わしい交絡変数を統計処理で差し引いたら、マシュマロ独自の効果はほとんど残らんかった」っていう話やったんや。回帰分析の記事で説明した「共変量を入れる」操作は、交絡を抑え込むための道具や。
3つの記事がいま繋がったわ。
📝 ここまでのおさらい
第3幕:じゃあ、本物の因果はどうやって確かめるのか
観察だけでは因果は決まらん、交絡変数に騙される——ってことやと、研究者はどうやって「これが原因や」って言い切れるようになるん?
ざっくり2つの道があるんや。1つは、観察データの中で「疑わしい交絡変数」を片っ端からリストアップして、統計処理で差し引く方法。これが、回帰分析の記事で説明した「共変量を投入する」ってやつや。
そっちは、もう何となくわかった。で、もう1つは?
もう一個はもっと強力な方法がある。ランダムに割り付けるってやつ。たとえば「朝食が学力を上げるか」を知りたいとするやろ。普通に観察するだけやと家庭環境が交絡する。そこで、くじ引きで「朝食を食べる組」と「食べへん組」に子どもを無作為に振り分けるんや。
くじ引き?
そう。くじ引きやから、家庭環境も、親の学歴も、子どもの元々の学力も、両方の組に似た割合で混ざる。裏の第三者を、両方の組に均等にバラけさせるわけや。
あ、均等になれば、裏の第三者の影響は差し引きチャラになるってことか。
せや。その状態で「朝食を食べた組」と「食べへん組」の学力を比べたとき、もし差が出たなら、他の条件は均等なんやから——それは朝食の効果と考えてええ。
おお、交絡を「先回りして潰す」方法か。賢いな。
これがランダム化比較試験(RCT)や。医療の薬の効果検証なんかが典型やな。ただ、子育てや教育の研究では、倫理的にくじ引きでやれんことも多い。「この子には朝食を食べさせません」なんて実験、そうそう許されへん。だから観察データ+共変量調整で頑張るしかない場面もある。マシュマロテストのWatts論文がまさにそれやった。
なるほどなぁ。「相関は因果じゃない」の裏には、こんだけドラマがあったんやな。
📝 ここまでのおさらい
補足:見かけの相関を生む、もうひとつの仕組み
交絡は「見かけの相関」の代表的な原因ですが、犯人はそれだけではありません。論文解説記事で遭遇しやすい、関連パターンを少しだけ紹介しておきます。
「見かけの相関」って、交絡以外にもあるん?
あるで。たとえば逆の因果。「練習量が多いチームほど勝率が高い」——これ、練習が勝率を上げてるのか、もともと強いチームほど練習する余裕があるだけなのか、データの線だけやと区別がつかん。AがBを引き起こしてるのか、BがAを引き起こしてるのか、矢印の向きが逆の可能性があるわけや。
あー、「相関はあるけど、思ってる因果じゃない」の別バージョンか。
もう一個はただの偶然。2つの時系列を見比べたら、何の関係もないのにたまたま一緒に動いて見える、っていうのがある。「ニコラス・ケイジが出演した映画の本数」と「プールで溺死した人の数」が年ごとに似た動きをしてる、みたいな有名なやつ。
それは笑うやろ(笑)。共通原因もないのに、偶然タイミングが合うだけか。
データ量が少ないと、偶然の一致が意味ありげに見えやすい。これも、観察だけでは因果が語れへん理由の一つや。
この用語に関連する記事
マシュマロテストシリーズ(交絡を解体した実例)
- マシュマロテスト神話を原典から解体する|全5回まとめ(1972→2024)──シリーズ全体の地図。「共変量を入れたら相関が消えた」の意味を射程単位で整理している
- マシュマロテストは再現できたのか?──Watts (2018) 追試が明かした「環境の力」──家庭環境という交絡変数を共変量に入れていくと、マシュマロの予測力が縮んでいく実例
- マシュマロテスト完全解体:50年の神話に引導を渡す判決「Sperber 2024」──26歳まで追跡した大規模研究で、交絡を統制するとマシュマロの効果はほぼ消えるという決定的な事例
用語解説シリーズ(交絡への統計的対処)
- 回帰分析とは?「共変量を入れたら効果が消えた」を理解するための基礎知識──共変量を入れる操作は、交絡変数を統計処理で差し引く道具。本記事の技術的な実装編として読むと、相互に補完し合う
- 相関関係=2つのものが一緒に動いている、という観察
- 因果関係=一方が原因で、他方が結果、という構造
- 観察するだけでは、相関と因果は区別できない
- 交絡変数=2つのあいだに「見かけの相関」を作り出す裏の第三者(共通の原因)
- 対処1=共変量を入れて統計的に調整する(観察研究)
- 対処2=くじ引きで群分けして交絡を均等化する(ランダム化比較試験/RCT)
- 「相関があるのに因果がない」には、交絡のほかに、逆の因果・ただの偶然のパターンもある
執筆後記
子育てをしていると、こういう「見かけの相関」に毎日のように遭遇します。「この絵本を読んだ日はよく眠る」「このおもちゃを出した日は集中する」。それ自体が悪いことではないのですが、真に受けて一般化しようとすると、たいてい裏切られる。裏にある共通原因——天気、体調、その日の疲労などが、両方をまとめて動かしているだけの場合が多いからです。なにより子どもは1日1日成長していて、先週あれだけ喜んで読んでいた本を、今日はためらいなくぶん投げる生き物です。比べている「同じ子ども」すら、実は昨日の子どもと今日の子どもでは別人で、観察の足場そのものが毎日ズレていく。これはもはや交絡とか逆の因果とか以前の話で、「そもそも固定した条件で比べる」ということ自体が成り立ちにくいのが、家庭という実験室の最大の難しさだと思っています。
そしてもう一つ厄介なのは、仮に2つのあいだに本当の関係があったとしても、今度は「鶏が先か、卵が先か」という別の問いが立ちはだかる、ということです。「絵本を読んだから眠れた」のか、「眠れそうな落ち着いた日だから、絵本タイムまで辿り着けた」のか。矢印の向きが逆かもしれない、というのは本文の補足で触れた逆の因果そのものです。
「勉強する子は成績が良い」も、勉強が成績を上げているのか、成績が良い(=勉強がわかる)から勉強が続くのか。日常の観察では、交絡と逆の因果がたいてい同時に効いていて、「AがBを引き起こしている」と素直に言い切れる場面の方がむしろ珍しい。鶏卵問題は哲学の昔話ではなく、因果を語るときに毎回立ち上がってくる実務上の難問なのです。
ひとつ補足しておきたいことがあります。「相関は因果じゃない」という決まり文句を、「だから観察研究は意味がない」と受け取ってしまうのは、極端に振れすぎだということです。観察研究でも、疑わしい交絡を一つずつ丁寧に潰していけば、因果の強い手がかりに辿り着ける場面はある。医学の世界で喫煙と肺がんの関係が因果として確立したのはRCTではなく、観察研究の積み重ねによってでした。
この記事を通して持ち帰ってほしいのは、「相関があるとき、裏に第三者はおらんか?」と自問するクセです。裏の第三者を一つも思いつけなかったら、因果の可能性は少し上がる。いくつも思いついたら、その相関だけで結論を出すのは危険。「相関は因果じゃない」と唱えるだけでは、論文解説記事は読み解けません。どんな交絡が疑われ、どんな調整がされ、それでも残ったものが何だったか——そこまで追えると、一気に景色が変わります。


コメント