Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 02-13-2009

最新の The American Statistician を読んでいたら 「ベンフォードの法則の簡単な説明」 (Fewster RM, "A simple explanation of Benford's Law" 2009),という論文が載っていた.面白かった.

-- -- -- --

ベンフォードの法則 とは・・・

「自然に発生したデータでは,一番上の位は1であることが多い」 というちょっと信じ難い法則.
本当は1から9のそれぞれの数字が現れる割合についてちゃんと言及している.シンプルなバージョンだと,一番上の位が x である割合は log(1+1/x, base=10)一番上の位の数字になれるのは1から9までなんだけど,みんな 1/9 ずつ起こるのではなくて,1であることがだいたい 30%で,2であることがだいたい 18%で,3が 13%.だんだん減っていって,最初の数字が9である確率は 5%未満となる.

いろんなデータに応用できる法則で,人口だとか,川の長さだとか,株価だとか,たくさんデータを集めてみると,その約 30% は一番上の位が1なんだそうだ.

この法則は19世紀末に発見されていたけれど,ちゃんとした数学的な証明が発表されたのは1995年だ.証明はすごく難しいらしい.ややわかり易い説明も検索すればみつかる.

わかり易く書いてある説明を読んでとりあえずは納得している.でもやっぱりいまいち信じ難い.

と言うわけで,確認してみた.

データは日本の市町村の人口.総務省:統計局のページからダウンロードできる.市町村名と数字だけの2行だけにしたデータは ここ

データを読み込んで,きれいにして,一番上の位を調べる,というのは R でやった.
ちなみに,一番上の位の数字を取り出すには floor( x / 10^floor(log(x,10)) ) とかで出来る.

1,805の市町村の人口の一番上の位をあらわしたのが下のグラフ.(大きいバージョン
青いラインは,ベンフォードの法則から予測される数.これによると,1と2で始まる人口がもう少し多いはずだけど,大まかに見てほぼ法則通りだ.確かに全体の3割ほどの市町村の人口は1で始まっている.

一番上の位割合
152529.1%
227215.1%
324713.7%
418410.2%
51669.2%
61267.0%
71086.0%
81015.6%
9764.2%

ほかのデータでも確かめてみた

平成17 平成18 平成19 平成20 平成21 平成22 平成23 平成24 平成25 平成26 平成27 平成28 平成29 平成30 令和元 令和2 令和3 令和4 令和5 令和6 令和7 令和810111210111213141516171819202122232425262728293031日 金曜日|統計学コメント(0)

コメント

コメントの投稿

ブログ検索

カレンダー

JanFebMar AprMay JunJulAugSepOctNovDec 2005200620072008200920102011
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -

履歴

2020年01月 (1)

2019年11月 (1)

2019年10月 (1)

2019年08月 (1)

2019年07月 (1)

2019年05月 (1)

2019年03月 (1)

2019年02月 (1)

2019年01月 (1)

2018年12月 (1)

2018年11月 (1)

2018年10月 (1)

2018年09月 (1)

2018年08月 (1)

2018年07月 (1)

2018年06月 (1)

2018年05月 (1)

2018年04月 (2)

2018年03月 (1)

2018年01月 (1)

2017年12月 (1)

2017年11月 (1)

2017年10月 (1)

2017年09月 (1)

2017年08月 (1)

2017年07月 (1)

2017年06月 (1)

2017年05月 (1)

2017年04月 (1)

2017年03月 (1)

2017年02月 (1)

2017年01月 (1)

2016年12月 (1)

2016年11月 (1)

2016年09月 (1)

2016年08月 (1)

2016年07月 (1)

2016年05月 (1)

2016年04月 (1)

2016年03月 (1)

2016年02月 (1)

2016年01月 (1)

2015年12月 (1)

2015年07月 (1)

2015年06月 (2)

2015年05月 (2)

2015年04月 (3)

2015年03月 (2)

2015年02月 (1)

2015年01月 (3)

2014年12月 (1)

2014年11月 (1)

2014年10月 (2)

2014年09月 (2)

2014年08月 (2)

2014年07月 (1)

2014年06月 (1)

2014年05月 (2)

2014年04月 (1)

2014年03月 (2)

2014年02月 (1)

2014年01月 (2)

2013年12月 (1)

2013年11月 (3)

2013年10月 (2)

2013年09月 (1)

2013年08月 (4)

2013年07月 (1)

2013年06月 (2)

2013年05月 (2)

2013年04月 (3)

2013年03月 (1)

2013年02月 (1)

2013年01月 (4)

2012年12月 (1)

2012年11月 (3)

2012年10月 (1)

2012年09月 (1)

2012年08月 (3)

2012年07月 (3)

2012年06月 (2)

2012年05月 (6)

2012年04月 (2)

2012年03月 (8)

2012年02月 (2)

2012年01月 (1)

2011年12月 (6)

2011年11月 (5)

2011年10月 (4)

2011年09月 (6)

2011年08月 (9)

2011年07月 (5)

2011年06月 (5)

2011年05月 (5)

2011年04月 (6)

2011年03月 (17)

2011年02月 (6)

2011年01月 (10)

2010年12月 (10)

2010年11月 (4)

2010年10月 (6)

2010年09月 (5)

2010年08月 (11)

2010年07月 (8)

2010年06月 (8)

2010年05月 (3)

2010年04月 (8)

2010年03月 (11)

2010年02月 (4)

2010年01月 (8)

2009年12月 (6)

2009年11月 (6)

2009年10月 (6)

2009年09月 (7)

2009年08月 (6)

2009年07月 (10)

2009年06月 (10)

2009年05月 (10)

2009年04月 (6)

2009年03月 (7)

2009年02月 (9)

2009年01月 (12)

2008年12月 (6)

2008年11月 (10)

2008年10月 (8)

2008年09月 (9)

2008年08月 (12)

2008年07月 (8)

2008年06月 (12)

2008年05月 (12)

2008年04月 (12)

2008年03月 (11)

2008年02月 (10)

2008年01月 (10)

2007年12月 (12)

2007年11月 (14)

2007年10月 (13)

2007年09月 (11)

2007年08月 (16)

2007年07月 (10)

2007年06月 (10)

2007年05月 (6)

2007年04月 (10)

2007年03月 (13)

2007年02月 (10)

2007年01月 (8)

2006年12月 (13)

2006年11月 (15)

2006年10月 (9)

2006年09月 (8)

2006年08月 (18)

2006年07月 (14)

2006年06月 (16)

2006年05月 (23)

2006年04月 (20)

2006年03月 (12)

2006年02月 (14)

2006年01月 (21)

2005年12月 (20)

2005年11月 (17)

2005年10月 (18)

2005年09月 (16)

2005年08月 (10)

2005年07月 (6)