ちょっと時系列解析を触ってみたかったのと神戸に移動するのに時間があったので、富士の人口推移をプロットしてみることにした。
どれどれと月別人口の推移にアクセスしたらあーエクセルかよ、、、。この表管理している人は、綺麗な表をつくるところが目的で、本来の目的である分析のためのデータだってことをすっかり忘れてるよなぁと思いつつ呪いの言葉を吐きながらコピペしてデータを作りなおした。(普段はpyEcelerator使ってるのでコピペなんてやんない。)
ところで、統計情報のページってデータのせるだけで、プロットしたり分析サマリーのせたりしないのね。不思議だ。
できたcsvはgoogle spreadsheetに保存しておいたので好きに使ってください。
プロット
2008年11月から旧富士川町の人口が増えているので合併時の人数を除いたデータでプロットしている。本来は2008年10月までの富士川町の人口推移を加えたほうがいいんだろうけど、データが見つからなかった。
fpop <- read.csv('fuji_pop.csv')
fpop.ts <- ts(fpop$norm_pop, start=1967, frequency=12)
plot(fpop.ts)
単に絶対数の比較をするだけでは、日本の人口変動の影響を排除できないのでノーマライズしてやる。日本の人口データはe-statの1番を使ったが、H12までのデータしかないので、総務省の2-1で補ったが、2010までしかなかった。それから日本の人口は月毎ではなくて年毎のデータを使っているのでギザギザになってる。
fpopr.ts <- ts(fpop$np_jp, start=1967, frequency=12)
plot(fpopr.ts)
まぁ、頭打ちから現象に転じてるのはほぼ確実でしょうかなぁ。僕はピュアな富士市民ではないのでイベントとグラフの変動を結びつけて解釈できないのが残念。
あとは人口構成比と結びつけてどのくらいの速さで人口が減少していくかとか、(老人世代が増えることで)活力が失われていくかとかそっちのほうが気になる。市でもそういう分析やってるんだろうか?やっているんだったら分析技法の参考にしたいのでみてみたいなぁ。
それから図書館ももっとRの蔵書増やしたほうがいいと思うよ。