Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 07-12-2006
アメリカのとある保険会社が「最も危険な交差点」リストを公開する。たぶん毎年やっていると思うけど、定かではない。この保険会社によせられた事故の報告を元にして作られたリスト。
このリストのトップになってしまった交差点、どうすれば交通事故の数を減らせるだろうか?予算は100万円。
僕なら・・・
100万円を着服して何もしない。それでも交通事故の数は減る。ま、かなりの高い確率で減る、としておこうか。(注1)
トップ10の平均だったら、何もしなくても、ほぼ間違いなく翌年には減る。(注2)
これは、"regression toward the mean" (平均への回帰)と呼ばれる現象(回帰現象)。大雑把に言うと、極端な現象はあまり連続して起こらない、ということ。
例1:血圧を下げる新たな薬の効果を試す。もともと高血圧の人を対象とした薬なので、100人の血圧を測ってそのうち血圧の高かった人50人にこの薬を与える。そのあとその50人の血圧を測ると、平均ではほぼ間違いなく血圧は下がる。水でも下がる。何もあげなくても下がる。最初に血圧を測った時に上位に入った人たちというのは、もともと血圧が高いということにプラスして、他の要因もあったに違いない。(体調が悪かった、緊張していた、ちょこっと運動した)そういう要因は二度目の時に必ずしも繰り返される訳ではないので、次に測定する時には、薬をあげなくても、血圧は下がる傾向にある。
例2:プロ野球で最初の一ヶ月間で打率が良かった選手に僕が呪いをかける。すると、その後打率は下がる。実は4月の終わりにメジャーで打率トップ20の選手達に呪いをかけた。
最初の1ヶ月(4月)の打率が上位20位に入った選手の5月の打率を見る。見てみた。拡大する
おぉ、僕の呪いはすごい。Alex Rios には効かなかったようだけど・・・
でも、これは僕の呪いが効いたのではなくて、平均への回帰が起きただけ。打率3割5分以上をキープするのはかなり難しいので、最初に打率の良かった選手を見ていけば、その後打率が下がるのは当たり前。逆に最初に打率が平均より悪かった選手を追っていけば、その後の打率は上がる傾向にある。
当たり前なんだけど、これで結構だませる。だまされる人も多い。最初の交通事故の例で、本当に市の予算を使って「ほら、お金をかけたらこんなに交通事故が減ったよ。すごいでしょ。税金無駄にしてないよ。」という市があったとする。危険な交差点を改善するのはいいことだけど、交通事故が減ったのを、全てその改善のおかげとするのは間違い。前年に全米トップ10に入るような交差点は、何もしなくても次の年はある程度減る。
今日の宿題 : 「二年目のジンクス」を「平均への回帰」で説明しなさい。
ちょっとそれるけど、「身に着けているだけで幸せになるネックレス」にも同じことが言える。幸せな人はたぶんそれを身に着けない。それを買おうとする人は、何かしら不幸せな状況にあることが多い。だからネックレスがなくてもきっとある程度改善されるに違いない。
という訳で
新興宗教:びいたま教
どうも最近悪いことが続くなぁ、ついてないなぁ、という時に静岡県藤枝市(びいとたまのお墓がある)の方角にむかって「びいさま、たまさま、ルルルルル」と唱えなさい。きっと何かご利益があるでしょう。調子がいい時にすると、調子悪くなるよ。
(注1と2 : アメリカ全体での交通事故の数がだいたい一定という仮定が必要かな。相対的にみて減る、ということだ。)
コメント
例1をもう少し説明してください。
最初に血圧が高くなかった50人は、薬を飲まないわけですよね?その人達は正常コントロールになるわけですか。でも、また次回測ったとき、その人達の血圧は平均への回帰をとるとすると、上がる事になるのでしょうか。それとも変わらない?
(そもそも高血圧の人って、何度測っても高血圧だと思うんですけど。)
ところで、ひまわりは素敵ですね。あんなに大きくなるんだ。びっくり。
二年目のジンクス。最初の年、調子が良かった選手は、二年目になると、調子が悪くなる。調子のよいのをキープするのは大変。二年目に悪くなるのは、平均への回帰が起きたから。
ところでビギナーズラックとは、平均への回帰で説明できる現象なのでしょうか。
眠くなってきたので考えられない。。。
低かった50人の平均は次にはあがります。
低かった50人をコントロールにしちゃうと、その人たちは血圧があがる傾向にあるので、ますます問題です。高かった50人をふたつにランダムに分ければ、たぶんそれほど問題ありません。でもみんな減る傾向にあるのであまり効率よい実験方法ではないかもしれません。
「平均よりもすごく高かった人は次も平均よりも高いけど、すごくは高くない傾向にある」というのが平均への回帰です。
50人ずつではなくて、上から10人、下から10人など、少数選抜にするとさらに顕著になります。
1年目の選手と2年目の選手と全体で見れば、さほど成績は違わないと思われます。
(1年目の成績が悪いと2年目には消えてるというのを考慮にいれる必要がありますが・・・)
だから、1年目に成績の良かった人しか見ないので、そのうち多くは2年目に成績が悪くなります。成績の良かった人も悪かった人もみぃんな見れば、全体としてはそんなに変わらないはずです。
ビギナーズラックはまた別ですが、例えばルーレット。大勝する確率が1%だとします。初心者とギャンブル好きを1000人ずつ集めたら、初心者でもそうでなくても、大勝する人は出てきます。その勝った人に「ビギナーズラックだったね」とか「下手な鉄砲数打ちゃ当たる、とはこのことだね」とか言います。負けた人には何もいいません。
「ビギナーズラックだったね」と言う人をたくさんの人の中から選んでいる、というだけです。
ビギナーズラックが起きた時に、「ビギナーズラックだ!」というのは間違いじゃありませんが、ビギナーもそうで無い人も広く見渡した時に、ビギナーだけが運が良い、ということはありません。
丁寧な説明をありがとうございます。
では、薬が本当に効果があった、と証明するためにはどんな実験パラダイムを組むべきなのでしょう(いえ別に私はそういう仕事をしてるわけではないのですが、単に興味があります)。
それからビギナーズラック、なんでこれを私は怪奇現象、ちがう、回帰現象に当てはめて考えようとしたのか、あまりに眠くて何を考えて書いていたのかわかりません(じゃ、書くなという話もありますが)。。。失礼しました。
この実験を効果的にするのは、たぶんきっと難しいでしょうね。実験に参加する人を選ぶ基準(血圧)と最後に観測する数値(やっぱり血圧)がいっしょだと、平均への回帰は避けるのが難しいです。血圧が高い人限定なので、結局やっぱり高い人50人を二群に分けるんじゃないでしょうか?最初に血圧を測定するのを一回だけじゃなくして、何回か測定すれば、ちょっとは改善されるでしょう。