Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 12-20-2010

長文注意.いつになく長い.

順番の比較

サッカー解説者やライターの順位予想はどのくらい当たっているのか? というページがあった.Jリーグが終わったので,シーズン前の順位予想の答え合わせをしてみよう,ということだ.

予想がどれくらい当たっていたかを判断するのに,予想の順位(1位から18位)と実際の順位との差を全部足して18で割る.つまり,平均でどれくらいずれているか.

この「差の平均」は,予想の正しさの指標として妥当なんだろうか?ま,18で割って平均にするのはややめんどくさいので「差の合計」を指標として使っているとしよう.同じことだ.

優勝したのは,佐藤俊さんで,差の合計は 50,平均は 2.78.2位の清水秀彦さんと3位の野々村芳和さんが同点で,合計 52,平均 2.89.次いで前園真聖さんと渡辺達也さんが同点で,合計 54,平均 3.00.

この計算方法は,まず,1位を当てるのも10位を当てるのも18位を当てるのも,同じ重要性としている.もしかしたら,上位をたくさん当てた人の方が予想としては優れているのかもしれない.Jリーグだと,下位のチームがJ2に落ちるので,下の方のチームを正確に予想するのも大切かもしれない.ま,それは差を合計するときになんらかの重みをつけて計算することによって,微調整が可能だけど,今回はシンプルに考える.1位も10位も18位も同じ重要性だとする.

外れたときのペナルティーをどう計算するかで,他の指標も考えられる.ここで使われている差(の絶対値)がシンプルだけど,差の2乗というのも容易に考えられる.差の2乗にすると,大きく外した場合のペナルティーがかなり大きくなる.

ちょっと違う考え方をしてみよう.

例として,実際の順位と佐藤さんの予想を使う.

チーム実際の順位佐藤さんの予想総当たり戦
名古屋1100
ガンバ2311
セレッソ31188
鹿島4222
川崎5411
清水6602
広島7924
横浜8713
新潟91677
浦和10824
磐田111766
大宮121204
山形131304
仙台141515
神戸151415
東京1651111
京都171077
湘南181800
-- ------5074

1位から18位まで予想するということは,結局全てのチームの組み合わせを見て,どっちのチームの方が順位が良いか,という判断を下す必要がある.例えば,優勝した佐藤さんの予想では,1名古屋,2鹿島,3ガンバ大阪,4川崎,5東京,となっている.これで言っていることは(ガンバに注目すると)ガンバ大阪は名古屋と鹿島よりは下だけど,川崎,東京よりは上.名古屋○×ガンバ,鹿島○×ガンバ,ガンバ○×川崎,ガンバ○×東京,ということだ.

18チームの総当り戦と考えられるので,全部で 153の直接対決があって,そのうち何組で正しく予測出来たかを指標として使えば良い.あるいは間違った予測の数をペナルティーとして足し算すればよい.

例の佐藤さんは,名古屋を正しく1位と予想したので,名古屋に関しては間違いは0.2位だったガンバを3位と予測して,鹿島を2位と予測した.つまりガンバに関しては,ガンバ×◯鹿島だけが間違いで,ペナルティーは1.実際に3位だったセレッソを佐藤さんは11位と予想した.鹿島,川崎,清水,広島,横浜,浦和,東京,京都の8チームが佐藤さんの予想ではセレッソより上位,実際にはセレッソより下位だったので,ペナルティーは8.

これを全てのチームに関して計算して和を求める.上の表の,総当たり戦の行だ.

予想と実際の順位があまり違わない場合,単純に計算した「差」の方法とあまり違いがないけれど,この総当たり戦順位の最大の利点は意味がストレートだということだ.「順位の上下関係が間違っていたペアの数(かける2)」.
それ以外の利点として,やや引き分けになりにくいかもしれない,というのもある.

佐藤さんの点は 74 だ.例えば清水対磐田に関して,清水の点を計算した時にも磐田の点を計算した時にも数えているので,間違ったペアの数は 74 を 2で割って 37だ.153の直接対決のうち,37の予想が違った.

例えば,実際は 1 >> 2 >> 3 >> 4 >> 5 だった5チームを 5 >> 4 >> 3 >> 2 >> 1 と予想すると,この総当り戦の考え方だと,1ペアも正しく予想できていない.でも,単純に差を計算したら,3位のチームは正確に予想したことになる.それはどうだろう?

「この5チームの中では他のチームとの相対評価は分からないけれど3位だろう」という考え方だったら正解だけど,こういう絶対評価を認めるならば,全てのチームを3位と予想するとか,2位が3チームと4位が2チームという予想も認めるべきだろう.そうしないで,16チームを1位から16位までに予想させるなら,相対評価をしていると思われるので,偶然当たってしまっても順位関係が間違いならば,それなりのペナルティーはあるべきで,総当たり戦の考え方がふさわしい.

Jリーグの順位予想をもう一度見てみた.

名前差の合計順位総当り順位
佐藤俊 501744
清水秀彦 522744
野々村芳和522662
前園真聖 544621
渡辺達也 544766
猪狩真一 566723
前田秀樹 5877810
早野宏史 5877810
中西哲生 587766
熊崎敬587766
G. エンゲルス60117810
木村浩吉 60118013
加部究 60118414
西部謙司 6011766
福西崇史 62158615
後藤健生 62158816
金田喜稔 66179619
山内雄司 66179417
浅田真樹 66179417
木崎伸也 782010220

そういう訳で,総当たり戦の考え方だと,優勝は前園さんだ.懐かしいな,前園さん.

でも「差の平均」が間違っているという訳ではないよ.どんな指標を使うかは主催者の自由だ.差の平均を推す理由は何だかわからないけれど.

総当り戦で勝ち負けがあっている数は『ケンドールの順位相関係数』に通ずる.どうでもいいんだけど.

平成17 平成18 平成19 平成20 平成21 平成22 平成23 平成24 平成25 平成26 平成27 平成28 平成29 平成30 令和元 令和2 令和3 令和4 令和5 令和6 令和7 令和810111210111213141516171819202122232425262728293031日 月曜日|統計学コメント(2)

ブログ検索

カレンダー

JanFebMar AprMay JunJulAugSepOctNovDec 2005200620072008200920102011
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 -

履歴

2020年01月 (1)

2019年11月 (1)

2019年10月 (1)

2019年08月 (1)

2019年07月 (1)

2019年05月 (1)

2019年03月 (1)

2019年02月 (1)

2019年01月 (1)

2018年12月 (1)

2018年11月 (1)

2018年10月 (1)

2018年09月 (1)

2018年08月 (1)

2018年07月 (1)

2018年06月 (1)

2018年05月 (1)

2018年04月 (2)

2018年03月 (1)

2018年01月 (1)

2017年12月 (1)

2017年11月 (1)

2017年10月 (1)

2017年09月 (1)

2017年08月 (1)

2017年07月 (1)

2017年06月 (1)

2017年05月 (1)

2017年04月 (1)

2017年03月 (1)

2017年02月 (1)

2017年01月 (1)

2016年12月 (1)

2016年11月 (1)

2016年09月 (1)

2016年08月 (1)

2016年07月 (1)

2016年05月 (1)

2016年04月 (1)

2016年03月 (1)

2016年02月 (1)

2016年01月 (1)

2015年12月 (1)

2015年07月 (1)

2015年06月 (2)

2015年05月 (2)

2015年04月 (3)

2015年03月 (2)

2015年02月 (1)

2015年01月 (3)

2014年12月 (1)

2014年11月 (1)

2014年10月 (2)

2014年09月 (2)

2014年08月 (2)

2014年07月 (1)

2014年06月 (1)

2014年05月 (2)

2014年04月 (1)

2014年03月 (2)

2014年02月 (1)

2014年01月 (2)

2013年12月 (1)

2013年11月 (3)

2013年10月 (2)

2013年09月 (1)

2013年08月 (4)

2013年07月 (1)

2013年06月 (2)

2013年05月 (2)

2013年04月 (3)

2013年03月 (1)

2013年02月 (1)

2013年01月 (4)

2012年12月 (1)

2012年11月 (3)

2012年10月 (1)

2012年09月 (1)

2012年08月 (3)

2012年07月 (3)

2012年06月 (2)

2012年05月 (6)

2012年04月 (2)

2012年03月 (8)

2012年02月 (2)

2012年01月 (1)

2011年12月 (6)

2011年11月 (5)

2011年10月 (4)

2011年09月 (6)

2011年08月 (9)

2011年07月 (5)

2011年06月 (5)

2011年05月 (5)

2011年04月 (6)

2011年03月 (17)

2011年02月 (6)

2011年01月 (10)

2010年12月 (10)

2010年11月 (4)

2010年10月 (6)

2010年09月 (5)

2010年08月 (11)

2010年07月 (8)

2010年06月 (8)

2010年05月 (3)

2010年04月 (8)

2010年03月 (11)

2010年02月 (4)

2010年01月 (8)

2009年12月 (6)

2009年11月 (6)

2009年10月 (6)

2009年09月 (7)

2009年08月 (6)

2009年07月 (10)

2009年06月 (10)

2009年05月 (10)

2009年04月 (6)

2009年03月 (7)

2009年02月 (9)

2009年01月 (12)

2008年12月 (6)

2008年11月 (10)

2008年10月 (8)

2008年09月 (9)

2008年08月 (12)

2008年07月 (8)

2008年06月 (12)

2008年05月 (12)

2008年04月 (12)

2008年03月 (11)

2008年02月 (10)

2008年01月 (10)

2007年12月 (12)

2007年11月 (14)

2007年10月 (13)

2007年09月 (11)

2007年08月 (16)

2007年07月 (10)

2007年06月 (10)

2007年05月 (6)

2007年04月 (10)

2007年03月 (13)

2007年02月 (10)

2007年01月 (8)

2006年12月 (13)

2006年11月 (15)

2006年10月 (9)

2006年09月 (8)

2006年08月 (18)

2006年07月 (14)

2006年06月 (16)

2006年05月 (23)

2006年04月 (20)

2006年03月 (12)

2006年02月 (14)

2006年01月 (21)

2005年12月 (20)

2005年11月 (17)

2005年10月 (18)

2005年09月 (16)

2005年08月 (10)

2005年07月 (6)