マルコフ連鎖モンテカルロ

SVMの流れで、MCMCとかベイズあたりを読んでる。

で、昔買ったけど最初の方の章だけ読んで放り投げてあったベイズ統計と統計物理を読んでたら、MCMCの話とかちゃんと書いてあって、面白かった。

で、尤度とか、事前分布、事後分布がまだイメージできないナァと、ちょっとググッたら、Bayesianってどういう考え方なんだろうというページがみつかった。

事後確率 = (尤度 * 事前確率)/エビデンス

エビデンスの部分の積分が困難なので、事後分布のシミュレーションをMCMCでやると。

ベイズ統計学のMCMCとの出会い

こんな感じの理解でいいのか?

binary QSAR

BinaryQSAR絡みでいろいろ、ごちゃごちゃやったりしてたのだが、群わけだったらSVMデいいじゃん、とふと思った。

ので、ベイズとSVMの違いを調べたら、それっぽいのがスラッシュドットにあった。

スラッシュドット ジャパン | ベイズ推定で楽々スパムメールをフィルタリング

世間では,ベイズ分類器しか出回ってないようですが,なぜ SVM を使わないのだろう?やってみたけれど思わしくないのか,それともそもそもやってみていないのか。

ベイズだと

  • 確率で出してくる(ので信頼性の目安にもなる?)
  • 回帰モデルじゃない
  • 回帰じゃないので計算速い

なんで、binaryQSARやるにはベイズはメリットあるのかな?

そしてRのコードも発見。★素敵★。

R

Binary QSAR is a non-linear modeling method that can be used to build models for binary categorical data (such as actives and inactives). It was described by Gao et al. (J. Chem. Inf. Comput. Sci., 1999, 39, 164-168) and Labute (Pacific Symposium on Biocomputing, 1999, 4, 444-455).

10094611 10380218