Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 12-31-2011
大晦日だ。
そば殻?
もちろんそば殻なんか使われていない。
やぎ。あまりにも良いのでアイフォンの待ち受け画面になった。
世界地図を見ていたら、「択捉島・1945年からロシアによって占領されている。日本が領土権を主張」と書いてあった。いかにも。
中米系スーパーでみつけたジーザスろうそく。使い道はよくわからないけれど、とりあえずインテリアなんだと思う。アップで見ると リアル でかなり怖い。
韓国系スーパーでみつけた十七茶。日本には負けたくないんだろうなぁ。
Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 12-21-2011
ところで、最近の日本のニュースと言えばTPP。環太平洋・・・協定。日本にとってプラスかマイナスか?とにかく一大ニュースだ。でも太平洋を渡ってみると、アメリカでは誰もそんなこと話題にしていない。ま、普通に生活していて耳にするニュースではない。
つい先日のロイターアメリカ版のニュースに載っていたけれど、その見出しが The most important trade deal you've never heard of だ。つまり『誰も聞いたことがないけれど最重要の貿易の話題』 アメリカでは誰も聞いたことがないニュース呼ばわりされている。
ここまで前置き。
僕はアメリカに住んでいるのでアメリカ産のお米を食べている。こしひかり品種。来年で創業100年のとある貿易会社が販売している。他にもキッコーマングループの貿易会社の名前もよく目にする。どちらも日本の会社だ。
最近、とあるアジア系食料品店で少し変なお米を見た。初めて見た。「こうふくまい」なら分からないでもないけどねぇ。
どうやら韓国の会社らしい。
すぐ隣に韓国語が書かれたお米も売っているんだけど、日本語で名前が書いてある方が売れるんだろうか?
日本人がいろいろと英語を使うのと同じ感覚なんだろうか?ちょっと違う気がする。
この会社のページに他のこうふくごめもあった。
Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 12-17-2011
Kaplan-Meier estimates をグラフにするプログラムを書いた。Rだ。
仕事上、何度となくグラフにしていて、その都度せくせくコードを書いていたのだけど、今回、昔書いたプログラムを大幅に改善した。生存曲線を書いて、下のマージンに numbers at risk を書く。
例。セットアップから。
library(survival)
kma <- survfit( Surv(time, status) ~ rx + adhere, data=colon )
この
僕が書いた function は
source('https://biostat.app.vumc.org/wiki/pub/Main/TatsukiRcode/RFunctions1.R')
で読み込める。
例の続き:
シンプルに
kmplot(kma, mark='',
xaxis.at=c(0,.5,1:9)*365, xaxis.lab=c(0,.5,1:9),
lty.surv=c(1,2), lwd.surv=1, col.surv=c(1,1,2,2,4,4),
col.ci=0,
group.names=c('Obs ','Obs tumor adh','Lev','Lev tumor adh',
'Lev+5FU ','Lev+5FU tumor adh'),
group.order=c(5,3,1,6,4,2),
extra.left.margin=6, label.n.at.risk=FALSE, draw.lines=TRUE,
cex.axis=.8, xlab='Years', ylab='Survival Probability',
grid=TRUE, lty.grid=1, lwd.grid=1, col.grid=grey(.9),
legend=TRUE, loc.legend='bottomleft',
cex.lab=.8, xaxs='r', bty='L', las=1, tcl=-.2
)
これでこの図が描ける。
唯一絶対必要なインプットは
まず
次に
その他のインプットは
図だけで、下の数字はいらないや、という場合は
他にも ggplot を使って似たようなことをした人は何人かいるけれど、ggplot なんか使わないで済むならそれにこしたことはない、と思う。
Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 12-11-2011
アイフォン4Sを買った。今までの使っていた携帯電話は、日本では10年くらい前に使っていたのと似た感じだったのでいきなりかなりのレベルアップ。テキストメッセージさえ送受信出来なかったんだから。写真は撮れるけれど撮った写真をどうしようもない。(ま、電話としてしか使わないプランだったからだけどね)
いきなりアイフォンだ。出先でメールチェックできるのは便利だね。ま、でもそんなに急ぎの用事なんかはめったにないのだけど、「あれ?ミーティングの場所どこだっけ?」ということがなくなる。理論上では。
ま、いいや。
そこで悲しいのがアイポッド。存在意義が無くなった。役立たず。無用。無駄。時代遅れ。全く存在意義が無いわけでもないか。今のところ思いつかないけれど。悲しさで言ったら(前にも使った比喩だけど)アニマルキングダムができたあとのジャングルクルーズだ。
Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 12-10-2011
10月にヴァンダービルト大学がとあるギネス記録を更新した。僕も貢献した。
「1日で何人にインフルエンザ予防接種を出来るでしょうか」記録。
記録は 12,850人。確か8時間だったか。今までの記録が 6,000人強だったので、一気に二倍。
つい先週、ヴァンダービルトの記録が正式にギネス記録として登録されたというニュースがあった。
平均で1分に30人弱に注射をしていたことになるので、かなりの規模だ。たしか常時40人が注射をしていた、とかそんなんだったと思う。
緊急時に大学関係者に速やかに予防接種をするプランというのがあるのだけど、それのテストを兼ねてのイベントだったらしい。
Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, 12-02-2011
例えばナッシュビル動物園に来る人は何人グループで来るんだろうか?という疑問を持ったとする。一人で来る人もいるだろうし、恋人同士もいるだろうし、家族4人とか、家族+親戚9人とか、学校の行事で120人ご一行様、とかもあるだろう。
ま、とりあえずグループの平均サイズを知りたいとしよう。理由はなんであれ、ね。
チケットを自動改札機に通す時に(本当はナッシュビル動物園にそんなハイカラなものはないのだけど)、ランダムにピピッとなるようにして、それがなった人に「あなたのグループは何人ですか?」と訊いてデータを集める。
ランダム(無作為)にサンプルを選んでいるので、このサンプルの平均を求めればきっとバイアス(偏り)の無い推定ができるに違いない。
違いない?
★☆☆★
例:とある小さな動物園に昨日やってきたグループは全てで10グループでした。小さな動物園だし、昨日は雨だったから10グループしか来なかったのだ。
グループのサイズは 1, 1, 2, 2, 2, 3, 4, 4, 4, 10。一人で来た写真家、雨の中のデート、雨天決行の強行ツアーグループ10人など。
平均グループサイズは (1+1+2+2+2+3+4+4+4+10)/10 = 3.3 で良い?
もし、平均グループサイズをこう定義すると、前述の「ランダムにピピッ」というサンプルのとり方では、使えるデータは取れない。というのも、グループの中で誰かひとりでもサンプルに入ればそのグループの人数がデータとして記録されるので、大きなグループほどサンプルに入りやすくなってしまうからだ。10人のグループはサンプルに入る確率が1人グループの10倍ある。
この弱小動物園の例で計算してみると、この日の入場者数は 33 人だ。その一人ひとりのグループサイズを考慮すると、グループサイズ1が2人、2が6人、3が3人、4が12人、10が10人ということになる。平均だと( 1 + 1 + 2+2 + 2+2 + 2+2 + 3+3+3 + 4+4+4+4 + 4+4+4+4 + 4+4+4+4 + 10+10+10+10+10+10+10+10+10+10 ) / 33 = 5.2。
平均グループサイズは 3.3? 5.2? どっち?