Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 12-20-2010
長文注意.いつになく長い.
サッカー解説者やライターの順位予想はどのくらい当たっているのか? というページがあった.Jリーグが終わったので,シーズン前の順位予想の答え合わせをしてみよう,ということだ.
予想がどれくらい当たっていたかを判断するのに,予想の順位(1位から18位)と実際の順位との差を全部足して18で割る.つまり,平均でどれくらいずれているか.
この「差の平均」は,予想の正しさの指標として妥当なんだろうか?ま,18で割って平均にするのはややめんどくさいので「差の合計」を指標として使っているとしよう.同じことだ.
優勝したのは,佐藤俊さんで,差の合計は 50,平均は 2.78.2位の清水秀彦さんと3位の野々村芳和さんが同点で,合計 52,平均 2.89.次いで前園真聖さんと渡辺達也さんが同点で,合計 54,平均 3.00.
この計算方法は,まず,1位を当てるのも10位を当てるのも18位を当てるのも,同じ重要性としている.もしかしたら,上位をたくさん当てた人の方が予想としては優れているのかもしれない.Jリーグだと,下位のチームがJ2に落ちるので,下の方のチームを正確に予想するのも大切かもしれない.ま,それは差を合計するときになんらかの重みをつけて計算することによって,微調整が可能だけど,今回はシンプルに考える.1位も10位も18位も同じ重要性だとする.
外れたときのペナルティーをどう計算するかで,他の指標も考えられる.ここで使われている差(の絶対値)がシンプルだけど,差の2乗というのも容易に考えられる.差の2乗にすると,大きく外した場合のペナルティーがかなり大きくなる.
ちょっと違う考え方をしてみよう.
例として,実際の順位と佐藤さんの予想を使う.
チーム | 実際の順位 | 佐藤さんの予想 | 差 | 総当たり戦 |
名古屋 | 1 | 1 | 0 | 0 |
ガンバ | 2 | 3 | 1 | 1 |
セレッソ | 3 | 11 | 8 | 8 |
鹿島 | 4 | 2 | 2 | 2 |
川崎 | 5 | 4 | 1 | 1 |
清水 | 6 | 6 | 0 | 2 |
広島 | 7 | 9 | 2 | 4 |
横浜 | 8 | 7 | 1 | 3 |
新潟 | 9 | 16 | 7 | 7 |
浦和 | 10 | 8 | 2 | 4 |
磐田 | 11 | 17 | 6 | 6 |
大宮 | 12 | 12 | 0 | 4 |
山形 | 13 | 13 | 0 | 4 |
仙台 | 14 | 15 | 1 | 5 |
神戸 | 15 | 14 | 1 | 5 |
東京 | 16 | 5 | 11 | 11 |
京都 | 17 | 10 | 7 | 7 |
湘南 | 18 | 18 | 0 | 0 |
-- -- | -- | -- | 50 | 74 |
1位から18位まで予想するということは,結局全てのチームの組み合わせを見て,どっちのチームの方が順位が良いか,という判断を下す必要がある.例えば,優勝した佐藤さんの予想では,1名古屋,2鹿島,3ガンバ大阪,4川崎,5東京,となっている.これで言っていることは(ガンバに注目すると)ガンバ大阪は名古屋と鹿島よりは下だけど,川崎,東京よりは上.名古屋○×ガンバ,鹿島○×ガンバ,ガンバ○×川崎,ガンバ○×東京,ということだ.
18チームの総当り戦と考えられるので,全部で 153の直接対決があって,そのうち何組で正しく予測出来たかを指標として使えば良い.あるいは間違った予測の数をペナルティーとして足し算すればよい.
例の佐藤さんは,名古屋を正しく1位と予想したので,名古屋に関しては間違いは0.2位だったガンバを3位と予測して,鹿島を2位と予測した.つまりガンバに関しては,ガンバ×◯鹿島だけが間違いで,ペナルティーは1.実際に3位だったセレッソを佐藤さんは11位と予想した.鹿島,川崎,清水,広島,横浜,浦和,東京,京都の8チームが佐藤さんの予想ではセレッソより上位,実際にはセレッソより下位だったので,ペナルティーは8.
これを全てのチームに関して計算して和を求める.上の表の,総当たり戦の行だ.
予想と実際の順位があまり違わない場合,単純に計算した「差」の方法とあまり違いがないけれど,この総当たり戦順位の最大の利点は意味がストレートだということだ.「順位の上下関係が間違っていたペアの数(かける2)」.
それ以外の利点として,やや引き分けになりにくいかもしれない,というのもある.
佐藤さんの点は 74 だ.例えば清水対磐田に関して,清水の点を計算した時にも磐田の点を計算した時にも数えているので,間違ったペアの数は 74 を 2で割って 37だ.153の直接対決のうち,37の予想が違った.
例えば,実際は 1 >> 2 >> 3 >> 4 >> 5 だった5チームを 5 >> 4 >> 3 >> 2 >> 1 と予想すると,この総当り戦の考え方だと,1ペアも正しく予想できていない.でも,単純に差を計算したら,3位のチームは正確に予想したことになる.それはどうだろう?
「この5チームの中では他のチームとの相対評価は分からないけれど3位だろう」という考え方だったら正解だけど,こういう絶対評価を認めるならば,全てのチームを3位と予想するとか,2位が3チームと4位が2チームという予想も認めるべきだろう.そうしないで,16チームを1位から16位までに予想させるなら,相対評価をしていると思われるので,偶然当たってしまっても順位関係が間違いならば,それなりのペナルティーはあるべきで,総当たり戦の考え方がふさわしい.
Jリーグの順位予想をもう一度見てみた.
名前 | 差の合計 | 順位 | 総当り | 順位 |
佐藤俊 | 50 | 1 | 74 | 4 |
清水秀彦 | 52 | 2 | 74 | 4 |
野々村芳和 | 52 | 2 | 66 | 2 |
前園真聖 | 54 | 4 | 62 | 1 |
渡辺達也 | 54 | 4 | 76 | 6 |
猪狩真一 | 56 | 6 | 72 | 3 |
前田秀樹 | 58 | 7 | 78 | 10 |
早野宏史 | 58 | 7 | 78 | 10 |
中西哲生 | 58 | 7 | 76 | 6 |
熊崎敬 | 58 | 7 | 76 | 6 |
G. エンゲルス | 60 | 11 | 78 | 10 |
木村浩吉 | 60 | 11 | 80 | 13 |
加部究 | 60 | 11 | 84 | 14 |
西部謙司 | 60 | 11 | 76 | 6 |
福西崇史 | 62 | 15 | 86 | 15 |
後藤健生 | 62 | 15 | 88 | 16 |
金田喜稔 | 66 | 17 | 96 | 19 |
山内雄司 | 66 | 17 | 94 | 17 |
浅田真樹 | 66 | 17 | 94 | 17 |
木崎伸也 | 78 | 20 | 102 | 20 |
そういう訳で,総当たり戦の考え方だと,優勝は前園さんだ.懐かしいな,前園さん.
でも「差の平均」が間違っているという訳ではないよ.どんな指標を使うかは主催者の自由だ.差の平均を推す理由は何だかわからないけれど.
総当り戦で勝ち負けがあっている数は『ケンドールの順位相関係数』に通ずる.どうでもいいんだけど.