Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 08-23-2006
今年のパイレーツは前半戦(オールスター以前)、1点差で負ける試合が多かった。それをグラフで表すにはどうしたらいいだろうか?
野球の試合の点のデータというのは、自分のチームの得点、相手の得点を対にして考えるのが自然だから、2次元のデータだ。パイレーツの得点だけ、 3, 4, 0, 7, 2, ... と見ても大して意味はない。取った点と取られた点をペアで、(3,2), (4,5), (0,1), (7,3), (2,1) と見なきゃね。
という訳で横軸にパイレーツの得点、縦軸に相手チームの得点を描くのが最も自然だ。でも、3-4 というスコアの試合はきっと何試合もある。それをどうしようか?
僕のグラフに対する信念のひとつに、『データは全て描く』というのがあるので、それを実行したい。
信念を復習しておこう。
○出来るならデータは全て描く
○データのあるところに描く、ないところは空白にする
○判りやすさのためにシンプルにしない
前置きはここまでで、パイレーツの2006年ど前半戦の得点と失点のグラフ。
クリックすると 拡大 します。
大きくして見た方が良い。さらに pdf もある。やっぱりこういう大切なグラフはいくら拡大しても質が下がらない pdf が良いね。
横軸がパイレーツの得点、縦軸が相手チームの得点。という訳で右下半分はパイレーツが勝った試合。左上がパイレーツが負けた試合。上部と左側の棒グラフはそれぞれの周辺分布。中身は1つの点が1試合。
何がわかるかな?
まず、左上の方が点が多い。これはたくさん負けている、ということだ。弱いからね、今年のパイレーツ。
さらに、対角線のすぐ上にデータが多い。これはまさに1点差で負けた試合。3-4で5試合、4-5で5試合負けてるのに対して、同じスコアで勝ったのはそれぞれ1試合ずつ。
左側の棒グラフ(相手チームの得点)で一番背が高いのが7点。それにひきかえ、パイレーツの得点で一番多いのは3点。ふたつの分布を比べて見たら、明らかに相手チームの得点の方が大きい。これじゃ、負ける試合が多いよね。
じゃ、強いチームも見てみる。今年の前半戦最も成績が良かったデトロイト・タイガーズ。
クリックすると 拡大 します。 →
pdf
まず明らかに右下に点が多い。たくさん勝っているということだ。しかも相手を完封した試合が11試合もある。こうして見ると、今年のタイガーズは相手の得点を抑えて勝っているのがわかる。得点の分布(上部の棒グラフ)はパイレーツのとさほど変わりはない。3点しか取ってない試合が一番多いところも同じだし。でも相手の得点の分布を比べると、メジャーで1番のチームと下から2番のチームの差は歴然。タイガーズは4点以上取った試合は6試合しか負けていない。これはすごい。
他のチームもご要望があれば、グラフにします。プログラムを書いてしまったから、それを実行するだけだからね。
実は去年までの成績だったら、すごく詳細なデータがあるから、もっと詳しく見ることが出来る。それはまた今度。
コメント
とても勉強になります。ちなみに、ソフトウェアは何ですか?
タイガーズは下のほうにキュっと詰まって見えますねー。
地に足がついてどっしりとしているようだ
パイレーツはふわりふわり・・・
情緒的に見てしまって申し訳ありません笑
ソフトウェアは R です。きれいなグラフを描くのには R が一番ですね。一番と書いたけれど、他を全く使わないので順位付けする資格はないのかもしれないけれど・・・
なるほど・・・どっしりしたチームとふわりふわりしたチーム。情緒的な解釈もいいですね。