入門機械学習は機械学習を使いたいヒトのための入門書であり、作りたいヒトのための本ではありませんので統計の本にあるような数式は全然出てきません。(これはこれでベイズの定理とか正則化とか説明できているのか?と疑問に思うところはあるのだが。)
お手軽にどういう問題の時にどういう手法を選択すればいいか?がわかるような内容になっているので、これはこれでありなのではなかろうかと。
とりあえず使ってみて機械学習がどんな感じのものなのかという感触をつかめばよいと思う。
事例としては
- 電子メールのスパム判定
- アマゾンのオススメみたいなの
- ウェブのアクセス数を予測する
- twitterのソーシャルグラフを分析する
といった感じで万人にオススメできるような内容になっています。
ちょっと残念なのは教師なし学習(クラスタリング)の手法(PCAとかMDS)の説明が超適当で、クラスタリングの素晴らしさについてほとんど触れられていないところと、SVMがおまけ程度でSVMのお手軽さがわからないのと、みんな大好きRandom forestに触れられていないあたりかなぁ。
それから本書のコードはRで書かれているのだけど、本書の内容の範囲だったらRなんて代入が<-になったjavascriptのようなものなので、ちょっとjavascriptを書いたことのあるプログラマーであれば、少ない労力で機会学習の基礎が学べて費用対効果的にかなりお得じゃないかと思う。
あとはggplot2のグラフ描画の快適さは癖になる。
本書を読んで
- より使いヒトはCRANのライブラリ漁りをすればいいし
- 作ってみたくなったヒトは王道のPRMLの方向に進んでいけばいい
かなと思う。
おまけ
ソーシャルグラフの分析にGephiをつかっていたのだけどCYtoscapeとの違いがちょっと気になったのであとで調べてみるかもしれない。