「褒めたら下がった」は錯覚？平均への回帰とダニング＝クルーガー効果の意外な関係

このシリーズは、当ブログの論文解説記事に登場する統計用語を、ヒューマンとエコノの掛け合いでゼロから解説するものです。論文記事を読んでいて「ここの意味がわからん」となったときに戻ってこられる場所、という位置づけです。

今回のお題は平均への回帰（回帰効果）。Krueger & Mueller (2002) で「ダニング＝クルーガー効果のパターンは回帰効果で説明できる」と主張されたアレ。Burson et al. (2006) で「上位者と下位者で回帰の方向が逆転する」と書かれたアレ。読んでいて「回帰効果って結局なんやねん」となった方は、ここで解消していってください。

サマリとこの記事でわかること
第1幕：「極端な成績は、次に普通に戻る」
第2幕：「褒めたら下がった。叱ったら上がった。だから叱るべき？」
第3幕：ダニング＝クルーガー効果と平均への回帰
補足：「運」って具体的に何？
本シリーズの他の記事で「平均への回帰」が登場する場面
執筆後記
この用語の関連する記事

サマリとこの記事でわかること

平均への回帰（回帰効果）とは、極端に良い（悪い）成績やスコアが、次の測定で平均的なところに戻りやすい現象のことです。

この記事でわかること

「平均への回帰」とは何か──極端な成績が次に普通に戻るしくみ
「褒めたら下がった」「叱ったら上がった」が錯覚である理由
ダニング＝クルーガー効果の論争と回帰効果のつながり

この記事は掛け合いが主役です。地の文は最小限。コーヒーでも飲みながらどうぞ。

第1幕：「極端な成績は、次に普通に戻る」

エコノ

ヒューマン、テストで学年1位取ったことある？

ヒューマン

ないけど？聞き方にトゲあるな。

エコノ

まあ仮にや。ある生徒が中間テストで学年1位を取ったとする。次の期末テスト、どうなると思う？

ヒューマン

うーん……実力あるんやったら、また上位やろ。でも「また1位」ってのは難しそうやな。

エコノ

そう。実際、次のテストでは順位が下がることが多い。逆に、中間テストで学年最下位だった生徒は、期末テストでは順位が上がることが多い。

ヒューマン

それは……最下位の子が頑張ったとか、1位の子が油断したとか、そういう話ちゃうん？

エコノ

それが、頑張ったとか油断したとか関係なく起きるんや。テストの点数には「実力」だけやなくて「運」が混ざってるからな。

ヒューマン

運？テストに運なんかあるか？

エコノ

あるで。たまたま前日に復習したとこが出た。たまたま体調が良かった。たまたまヤマが当たった。逆に、たまたま寝不足やった。たまたま苦手な範囲が多かった。テストの点数は「実力＋その日のいろんな偶然」の合計や。

ヒューマン

まあ……言われてみれば、そうか。

エコノ

で、学年1位を取った生徒ってのは、実力が高いのは間違いないけど、その日の運もプラス方向に振れてた可能性が高いんや。実力だけで1位取れるほど突き抜けてるケースは稀で、たいてい「実力＋良い運」の合わせ技で1位になっとる。

ヒューマン

あー。で、次のテストでは運のぶんがリセットされるから、実力相応の順位に戻る……ってことか？

エコノ

そういうこっちゃ。運は毎回ランダムにリセットされる。だから次のテストでは「実力＋普通の運」に戻りやすい。結果的に、1位だった子は順位が下がる。最下位だった子も同じ理屈で、「悪い運」のぶんがリセットされて順位が上がる。

ヒューマン

極端な成績は、次に「普通のあたり」に戻る。

エコノ

そう。その現象に名前がついてる。平均への回帰、英語ではregression to the meanって呼ぶ。回帰効果とも言う。「回帰」って言葉がややこしいけど、「平均のほうに戻っていく」というだけの意味や。覚えてほしい用語やで。

📝 ここまでのおさらい

テストの点数は「実力＋運（偶然の要素）」の合計
極端に良い（悪い）成績は、運がプラス（マイナス）に振れた結果であることが多い
次の測定では運がリセットされるので、成績は平均的なところに戻りやすい。これが平均への回帰（回帰効果）

ここまでが「平均への回帰」の骨格です。次は、「これを知らないと何を間違えるのか」を見ていきます。

第2幕：「褒めたら下がった。叱ったら上がった。だから叱るべき？」

エコノ

ヒューマン、部活の顧問やってるとするやん。ある選手が試合で大活躍したから褒めた。次の試合、その選手のパフォーマンスは下がった。どう思う？

ヒューマン

「褒めたら調子に乗って手を抜いた」とか思うかもな。

エコノ

逆に、別の選手がボロボロだったからめちゃくちゃ叱った。次の試合、その選手のパフォーマンスは上がった。

ヒューマン

「叱ったから気合い入れ直した」って思うやろな。つまり「褒めるより叱るほうが効果的」ってこと……？

エコノ

そう結論づける人、めちゃくちゃ多い。でもこれ、第1幕の話そのままや。

ヒューマン

……あ。大活躍した選手は「運がプラスに振れてた」から、次は普通に戻る。ボロボロだった選手は「運がマイナスに振れてた」から、次は普通に戻る。

エコノ

そう。褒めようが叱ろうが、何もしなくても結果は平均に戻ってたんや。なのに人間は「自分の介入（褒めた/叱った）が結果を変えた」と思い込む。

ヒューマン

うわ……これ、日常でめっちゃやってそうやな。子どもがテストで良い点取ったからご褒美あげた、次は下がった、「ご褒美が良くなかった」みたいな。

エコノ

カーネマンがまさにこの話をしてる。イスラエル空軍の教官が「褒めると次に下手になる。叱ると次にうまくなる。だから叱るべきだ」と主張した話。カーネマンは「それは平均への回帰であって、褒めや叱りの効果ではない」と指摘した。

ヒューマン

なるほど……。つまり「極端な結果の後に何かした → 次に普通に戻った」のを、「自分がしたことのおかげ」と勘違いしてしまう、と。

エコノ

そういうこっちゃ。平均への回帰を知らないと、「本当は何もしなくても起きた変化」に、後付けで原因をくっつけてしまう。これが平均への回帰で一番怖いポイントや。

ヒューマン

あ、これ、Krueger & Mueller (2002) の記事で出てきた話に関係あるやつやんな？　「ダニング＝クルーガー効果のパターンは回帰効果で説明できる」ってやつ。

エコノ

よう覚えとるな。まさにその話とつながる。それは第3幕でやろう。

📝 ここまでのおさらい

極端な結果の後に平均へ戻る現象は、何も介入しなくても自然に起きる
「褒めたら下がった」「叱ったら上がった」は、介入の効果ではなく平均への回帰の可能性がある
平均への回帰を知らないと、偶然の変動に後付けで原因をくっつけてしまう

第3幕：ダニング＝クルーガー効果と平均への回帰

ここからは、この用語がブログの論文解説記事でどう使われているかを見ていきます。

エコノ

ダニング＝クルーガー効果の話、覚えてる？　「できない人ほど自分を過大評価し、できる人ほど自分を過小評価する」ってやつ。

ヒューマン

覚えてるで。で、Krueger & Mueller (2002) が「あれは回帰効果で説明できる」って言ったんやろ？でも正直、あの記事読んだとき「回帰効果ってなんやねん」ってなって半分ついていけんかった。

エコノ

今の知識で整理しよう。ダニング＝クルーガーの実験では、テストを受けてもらった後に「自分は何パーセンタイルくらいだと思う？」と聞くんやったな。

ヒューマン

そうそう。で、下位の人は自分を高く見積もって、上位の人は自分を低く見積もる、ってパターンが出た。

エコノ

ここで第1幕の話を当てはめてみ。テストの成績には運が混ざるやろ。最下位グループの人たちは、実力も低いけど、その日の運がマイナスに振れて余計に低くなってる可能性がある。

ヒューマン

ふむ。

エコノ

この人たちに「自分は何パーセンタイルだと思う？」と聞くと、実力相応のあたり──つまり最下位よりは上のほうを答える。テストの成績が「実力＋悪い運」で極端に低かったのに、自己評価は「実力相応」に近い。結果的に「自分を過大評価している」ように見える。

ヒューマン

おお……。逆に上位グループは「実力＋良い運」で極端に高かったのに、自己評価は実力相応のあたりを答えるから「自分を過小評価している」ように見える？

エコノ

そういうこっちゃ。Kruegerはこれを「ダニング＝クルーガー効果に見えるパターンは、平均への回帰で──つまりテスト成績のほうが極端にブレただけで──説明できる」と主張したんや。メタ認知がどうとか関係なく。

ヒューマン

待って。てことは、「できない人は自分の能力がわからない」っていうダニング＝クルーガーの説明は間違いってこと？

エコノ

「間違い」とまでは言いきれへん。Kruegerの主張は「回帰効果だけでもあのパターンは出る。だからメタ認知の欠如を持ち出す必要があるかどうか、もう一回考えろ」ってことや。第2幕の教官の話と構造は同じ。「本当に介入（メタ認知の欠如）の効果なのか、それとも平均への回帰で説明できる見かけ上のパターンなのか」。

ヒューマン

あー。「叱ったから成績が上がった」と思い込んでたのと同じで、「メタ認知がないから過大評価してる」と思い込んでるかもしれない、って話か。

エコノ

完璧な理解や。で、Burson et al. (2006) は、課題の難易度を変えることで回帰の方向を逆転させてみせた。簡単な課題では下位者が過大評価するけど、難しい課題では上位者が過大評価する。これは「メタ認知の欠如」だけでは説明しにくいけど、平均への回帰と統計的なノイズを考えると説明がつく。

ヒューマン

なるほど……回帰効果って、ダニング＝クルーガー効果の記事を読むための必須知識やったんやな。

📝 ここまでのおさらい

ダニング＝クルーガー効果の「できない人ほど過大評価」パターンは、平均への回帰だけでも説明できるとKrueger (2002) が主張した
テスト成績が「実力＋運」で極端にブレているのに、自己評価は実力相応のあたりに戻る。結果的に「過大評価/過小評価」に見える
これは「本当にメタ認知の問題なのか、それとも統計的なアーティファクト（見かけの現象）なのか」という論争の核心

補足：「運」って具体的に何？

ヒューマン

さっきから「運」って言ってるけど、もうちょっと具体的に言うと何なん？

エコノ

ざっくり言うと、測定のたびにランダムに変わる要素ぜんぶや。テストやったら「その日の体調」「出題範囲との相性」「直前に復習した範囲が出たかどうか」。スポーツやったら「風向き」「相手のコンディション」「審判の判定」。測定のたびに値が変わるノイズのことを、統計では誤差とか測定誤差って呼ぶ。

ヒューマン

「運」＝毎回ランダムに変わるノイズ、ってことか。

エコノ

そういうこっちゃ。で、このノイズが大きいほど、平均への回帰も大きくなる。テストの信頼性が低い（毎回の点数のブレが大きい）ほど、回帰効果が強く出る。逆に、身長みたいにほとんどブレないものは、回帰効果もほとんど起きへん。

ヒューマン

あー、Bursonの記事で「テストの信頼性」って話が出てきたのは、ここに関係してたんか。

エコノ

その通り。信頼性が低いテストほど回帰効果が強くなる。Bursonが「課題の難易度で効果が逆転する」って示せたのも、難易度を変えることでテストの信頼性やノイズの構造が変わるからや。この話は深掘りすると別記事のテーマになるから、ここでは「ノイズが大きいほど回帰も大きい」とだけ覚えといてくれ。

本シリーズの他の記事で「平均への回帰」が登場する場面

平均への回帰の知識があると、以下の記事の理解が深まります。

ダニング＝クルーガー効果シリーズ

Krueger & Mueller (2002)：「ダニング＝クルーガー効果のパターンは回帰効果＋BTA効果で再現できる」という主張の中核。テスト成績の極端なブレ（回帰効果）が、自己評価との乖離を生むメカニズム
Burson et al. (2006)：課題の難易度を変えると回帰の方向が逆転し、「上位者こそ過大評価する」パターンが出現。テストの信頼性と回帰効果の関係が鍵になる

この記事のまとめ

平均への回帰（回帰効果）＝極端な成績・スコアは、次の測定で平均的なところに戻りやすい現象
成績は「実力＋運（ランダムなノイズ）」の合計。極端な成績は運が偏った結果であることが多い
次の測定では運がリセットされるので、成績は実力相応のあたりに戻る
平均への回帰を知らないと、「何もしなくても起きた変化」に後付けで原因をくっつけてしまう（褒めた/叱ったの効果と誤認）
ダニング＝クルーガー効果の「できない人ほど過大評価」パターンも、回帰効果だけで説明できる可能性がある（Krueger, 2002）
ノイズ（測定誤差）が大きいほど、平均への回帰も大きくなる

執筆後記

お子さんがいる方なら、覚えがあると思います。テストでめっちゃええ点を取ってきた。習い事の発表会でびっくりするくらい上手だった。嬉しくなって「すごいやん！」と褒めて、ちょっと良いおやつなんか出したりして。──で、次はいつも通りに戻る。「褒めたら調子に乗ったかな」と、一瞬よぎる。

逆もまた然りで、テストがボロボロだった、習い事でぜんぜんダメだった。「ちゃんとやりなさい」と叱ったら、次はそこそこ持ち直す。「やっぱり言うべきことは言わないとな」と、自分の対応に納得する。

でも今なら、平均への回帰だったとわかります。めっちゃ良かった回は「実力＋良い運」の合わせ技で、次は運がリセットされて実力相応に戻っただけ。ボロボロだった回も「実力＋悪い運」で、次は普通に戻っただけ。褒めたことも叱ったことも、たぶん関係なかった可能性がある。

ひとつ補足しておくと、平均への回帰は「みんな結局は平凡に収まる」という話ではありません。回帰するのは運のぶんであって、実力のぶんは残ります。だから、実力そのものが振り切れている人は、運がリセットされても依然として異常値です。

たとえば日本時代のイチロー選手。調子が悪いと言われたシーズンでも首位打者。平均への回帰が起きているはずなのに、回帰した先がまだ異常値。これが「実力が振り切れている」ということです。

「極端な結果のあとに起きた変化」を見たとき、それが本当に介入の効果なのか、単に平均に戻っただけなのか。そしてそもそも、その「極端」は運のせいなのか実力なのか。その問いを立てられるかどうかで、判断の質がまるで変わってくるのだと思います。

この用語の関連する記事

ダニング＝クルーガー効果シリーズ（回帰効果が論争の核心）

ダニング＝クルーガー効果の嘘・本当｜「メタ認知が原因」は反証されたのか？──原論文 Kruger & Dunning (1999) の実験結果と、その後の論争の全体像
ダニング＝クルーガー効果の原因はメタ認知ではない？ Krueger & Mueller (2002)──「回帰効果＋BTA効果で再現できる」という反論の中核
ダニング＝クルーガー効果は「難しいタスク」で逆転する Burson (2006)──課題の難易度を変えると回帰の方向が逆転する実証