Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 08-19-2006

職業柄、グラフをよく描く。かなり真剣にグラフについて考える。ま、それが仕事だ。ここ10年ほどで、ある種の信念のようなものが確立されつつある。

○出来ることなら全てのデータを表示する。
○データの無いところは空白にする。
○見やすさ、飲み込みやすさの為に質を下げてはいけない。

医学の世界でよく見る下のようなグラフ。全くだめ。でもよく見る。みんながやってるから私も、という考えで広まって行ったのだと思う。たいてい、棒の高さが平均、ひげが標準偏差を表す。

何が悪いか。
○それぞれのグループの平均しか表されていない。これだけスペースを使って4個の平均だけ?
○余分なひげのせいで、見にくい。パッと見て高さの判断をしかねる。
○こんな風に標準偏差を付け足したところで大した情報ではない。
○どうせこれだけスペースを使うのなら全部のデータを表そうよ。全部でないにしてももっとたくさん。何で平均一個にまとめちゃうのさ。
○これが一番の問題点なんんだけど・・・基本姿勢として、データのあるところに描く。データのないところは空白にする。棒の頂上が平均だから、その上にもデータはあるんだけど、空白。それにひきかえ、多分0のすぐ上にはデータは無いのだろうけど、しっかり色が塗られている。それが気に入らない。

最近医学の世界でも、ちゃんとした学会誌ではこういう図はすぐ却下されるようになってきた。ダイナマイトプロットというらしい。マンガでよく見るダイナマイトのスイッチみたいしょ。

それでは、代わりに何を使えばいいのか。ダイナマイトプロットを使うようなデータはたいてい箱ひげ図できちんと表すことができる。箱ひげ図の解説はここではしない。検索すればみつかるよ。データの数が巨大でなければ、僕は全ての点を描く方が好きだけどね。

ところで上のグラフから何がわかるだろうか?

A と B、C と D はそれぞれ全くいっしょ。データのばらつきは C,Dの方が少し小さい、など。

ちゃんとしたグラフでデータを見てみよう。

大間違い。

もちろんこれは恣意的に極端な例を作ったのだけど、ダイナマイトプロットのそもそもの問題点は、恣意的にこういう例が作れてしまう、という点だ。だませる。全てのデータを描くと、そういうことはできない。

平成17 平成18 平成19 平成20 平成21 平成22 平成23 平成24 平成25 平成26 平成27 平成28 平成29 平成30 令和元 令和2 令和3 令和4 令和5 令和6 令和7 令和810111210111213141516171819202122232425262728293031日 土曜日|統計学コメント(0)

コメント

コメントの投稿

ブログ検索

カレンダー

JanFebMar AprMay JunJulAugSepOctNovDec 2005200620072008200920102011
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -

履歴

2020年01月 (1)

2019年11月 (1)

2019年10月 (1)

2019年08月 (1)

2019年07月 (1)

2019年05月 (1)

2019年03月 (1)

2019年02月 (1)

2019年01月 (1)

2018年12月 (1)

2018年11月 (1)

2018年10月 (1)

2018年09月 (1)

2018年08月 (1)

2018年07月 (1)

2018年06月 (1)

2018年05月 (1)

2018年04月 (2)

2018年03月 (1)

2018年01月 (1)

2017年12月 (1)

2017年11月 (1)

2017年10月 (1)

2017年09月 (1)

2017年08月 (1)

2017年07月 (1)

2017年06月 (1)

2017年05月 (1)

2017年04月 (1)

2017年03月 (1)

2017年02月 (1)

2017年01月 (1)

2016年12月 (1)

2016年11月 (1)

2016年09月 (1)

2016年08月 (1)

2016年07月 (1)

2016年05月 (1)

2016年04月 (1)

2016年03月 (1)

2016年02月 (1)

2016年01月 (1)

2015年12月 (1)

2015年07月 (1)

2015年06月 (2)

2015年05月 (2)

2015年04月 (3)

2015年03月 (2)

2015年02月 (1)

2015年01月 (3)

2014年12月 (1)

2014年11月 (1)

2014年10月 (2)

2014年09月 (2)

2014年08月 (2)

2014年07月 (1)

2014年06月 (1)

2014年05月 (2)

2014年04月 (1)

2014年03月 (2)

2014年02月 (1)

2014年01月 (2)

2013年12月 (1)

2013年11月 (3)

2013年10月 (2)

2013年09月 (1)

2013年08月 (4)

2013年07月 (1)

2013年06月 (2)

2013年05月 (2)

2013年04月 (3)

2013年03月 (1)

2013年02月 (1)

2013年01月 (4)

2012年12月 (1)

2012年11月 (3)

2012年10月 (1)

2012年09月 (1)

2012年08月 (3)

2012年07月 (3)

2012年06月 (2)

2012年05月 (6)

2012年04月 (2)

2012年03月 (8)

2012年02月 (2)

2012年01月 (1)

2011年12月 (6)

2011年11月 (5)

2011年10月 (4)

2011年09月 (6)

2011年08月 (9)

2011年07月 (5)

2011年06月 (5)

2011年05月 (5)

2011年04月 (6)

2011年03月 (17)

2011年02月 (6)

2011年01月 (10)

2010年12月 (10)

2010年11月 (4)

2010年10月 (6)

2010年09月 (5)

2010年08月 (11)

2010年07月 (8)

2010年06月 (8)

2010年05月 (3)

2010年04月 (8)

2010年03月 (11)

2010年02月 (4)

2010年01月 (8)

2009年12月 (6)

2009年11月 (6)

2009年10月 (6)

2009年09月 (7)

2009年08月 (6)

2009年07月 (10)

2009年06月 (10)

2009年05月 (10)

2009年04月 (6)

2009年03月 (7)

2009年02月 (9)

2009年01月 (12)

2008年12月 (6)

2008年11月 (10)

2008年10月 (8)

2008年09月 (9)

2008年08月 (12)

2008年07月 (8)

2008年06月 (12)

2008年05月 (12)

2008年04月 (12)

2008年03月 (11)

2008年02月 (10)

2008年01月 (10)

2007年12月 (12)

2007年11月 (14)

2007年10月 (13)

2007年09月 (11)

2007年08月 (16)

2007年07月 (10)

2007年06月 (10)

2007年05月 (6)

2007年04月 (10)

2007年03月 (13)

2007年02月 (10)

2007年01月 (8)

2006年12月 (13)

2006年11月 (15)

2006年10月 (9)

2006年09月 (8)

2006年08月 (18)

2006年07月 (14)

2006年06月 (16)

2006年05月 (23)

2006年04月 (20)

2006年03月 (12)

2006年02月 (14)

2006年01月 (21)

2005年12月 (20)

2005年11月 (17)

2005年10月 (18)

2005年09月 (16)

2005年08月 (10)

2005年07月 (6)