Drkcore

15042010 PRML

PRML4章

4.2にちょっと感動。

ロジスティック回帰で出てくるオッズ比はまぁそんなもんなのかなとかいって天下り的に覚えてたんだけど。

クラス分類の事後確率から考えていくほうが僕にとっては自然だ。

2クラスの分類問題（活性ありなしとか）を考えると事後確率は以下の式で表される。

$p(C1|x) = \frac{p(x|C1)p(C1)}{p(x|C1)p(C1) + p(x|C2)p(C2)}$

分子で割ると

$p(C1|x) = \frac1{1 + \exp(-\alpha)}$

但し、αは以下の式で表される。

$\alpha = \ln{\frac{p(x|C1)p(C1)}{p(x|C2)p(C2)}}$

これはロジスティックシグモイド関数となる。

パターン認識と機械学習上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 6,825 ()
在庫あり。

14042010 PRML

パーセプトロン

パターン認識と機械学習を読み直していて今4章。

図4.7のパーセプトロンのイメージが大変わかりやすいことに気づいて感激したのであった。

パターン認識と機械学習上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ?円 ( 2007-12-10 )

いまは、Pinheiroを読むのに苦労している。

Mixed-Effects Models in S and S-PLUS (Statistics and Computing)
José Pinheiro
Springer / 2859円 ( 2009-04-15 )

これをきちんと理解しないと、PK-PDが進まないんだよな。

Pharmacokinetic-Pharmacodynamic Modeling And Simulation
Peter L., Ph.D. Bonate
Springer / 7596円 ( 2005-11 )

23092009 PRML MCMC JAGS

JAGSでマルコフ連鎖モンテカルロ法

連休は旅行いったりとか子供と遊んでたんだけどそれ以外はJAGSいじってた。

マルコフ連鎖モンテカルロ法 (統計ライブラリー)
豊田秀樹
朝倉書店 / ￥ 4,410 ()
在庫あり。

5章をWikiに書いていくことにした。

マルコフ連鎖モンテカルロ法をJAGSで

分散分析のあたりを出来るようにしておくとよいと思った。

5.1　ロジスティック回帰モデル　
5.2　メタ分析　
5.3　多項ロジットモデル　
5.4　対数線形モデル　
5.5　ポアソン回帰　
5.6　2値データに対する回帰分析　
5.7　トービット回帰モデル　
5.8　変曲点のある回帰分析　
5.9　生存時間分析(ワイブル回帰)　
5.10　生存時間分析(コックス回帰)　
5.11　時系列モデル　
5.12　分散分析　
5.13　分散成分分析　
5.14　分散分析(枝分かれ配置)　
5.15　一般化可能性理論　
5.16　反復測定データの分散分析　
5.17　階層線形モデル　
5.18　項目反応理論(2母数2値モデル)　
5.19　項目反応理論(段階反応モデル)　
5.20　項目反応理論(名義反応モデル)　
5.21　項目反応理論(部分採点・評定尺度モデル)
5.22　項目反応理論(連続反応モデル)
5.23　多次元IRT
5.24　項目反応理論(混合名義反応モデル)　
5.25　項目反応理論における特異項目機能(DIF) の分析　
5.26　正規混合モデル　
5.27　潜在クラス分析　
5.28　成長曲線モデル　
5.29　非線形成長曲線モデル　
5.30　因子分析　
5.31　多母集団分析　
5.32　非線形SEM

あとこの本だけだと難しすぎるのでPRMLの下巻が必須(多分)。

パターン認識と機械学習下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 8,190 ()
在庫あり。

18082009 R PRML MCMC

SIR(sampling-importance-resampling)

水産資源学におけるベイズ統計の応用ワークショップのスライドの22,23枚目

g(x)からM個のサンプルx1*, …, xM*を発生
w*= f(x*)/g(x*)を計算
x1*, …, xM*からw1*, …, wM*に比例する確率でサンプルをm個とってくる
得られたm個のサンプルはf(x)からの事後サンプル

となっているのだが、23枚目のRのコードは

n2 <-sample(length(x1), 1000, replace=T, prob=dlnorm(x1,1.1,0.6))

とwを求めずにいきなりサンプリングしているので？となったが、一様分布だから重みを計算する必要ないのね。

わざわざ書くならこうか。

x1 <-runif(100000,0,60)
w <- dlnorm(x1,1.1,0.6) / (dunif(x1,0,60))
n2 <-sample(length(x1), 1000, replace=T, prob=w)
x2 <-x1[n2]
plot(density(x2))

パターン認識と機械学習下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 8,190 ()
在庫あり。

15082009 Python matplotlib PRML

Box-MullerをPythonで

PRML11章。一様乱数から正規乱数を発生させる。

from math import sin,cos,pi,log,sqrt
from random import random

def box_muller():
    z1 = random()
    z2 = random()
    return sqrt(-2*log(z2)) * sin(2*pi*z1)

if __name__ == "__main__":
    from pylab import *
    x = [box_muller() for i in range(10000)]
    hist(x,20)
    savefig("box_muller.png")

box_muller

パターン認識と機械学習下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 8,190 ()
在庫あり。

13082009 chemoinformatics R PRML

カーネル主成分分析

普通のPCAとちがうのは非線形主成分を扱えること。でも、カーネル関数をうまく選ばないといけないことを意味する。

Rとカーネル法を参考に。

> library(kernlab)
> x <- as.matrix(iris[,1:4])
> iris.kpc1 <- kpca(x,kernel="rbfdot",feature=2,kpar=list(sigma=0.1))
> plot(pcv(iris.kpc1),col=as.integer(iris[,5]))

kpca

あータニモトカーネルを使ったkernel PCAとかなんかいいかもしれない。

パターン認識と機械学習下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 8,190 ()
在庫あり。

06082009 R PRML

Rでベータ分布

PRMLも再読してるが、手動かしながら読むほうがしっくりくる。 p.70のベータ分布の逐次学習ってのが面白そうなのでやってみた。

パターン認識と機械学習上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 6,825 ()
在庫あり。

data <- rbinom(30,1,0.5)

plot_dbeta <- function(data){
a <- 0
b <- 0
x <- seq(0.01, 1.0, len = 500)
for (i in 1:length(data)) {
    if(data[i] == 1) { a = a + 1 } 
    else             { b = b + 1 }
    if(i>3){
    if(i==4){ plot(x, dbeta(x,a,b),type = "l",col=i,ylim=c(0,5)) }
    else    { plot(x, dbeta(x,a,b),type = "l",col=i,xlab="",ylab="",axes=F,ylim=c(0,5)) }
    par(new=T)
    }
}
}

二項分布で30個のリストを発生させて読みながらa,bのデータを更新していきつつその時のベータ分布の密度を求めつつプロットしていくという操作。

> data
 [1] 1 0 1 1 0 0 0 1 0 0 0 1 0 0 1 1 1 0 1 0 0 0 1 0 0 1 0 1 0
[30] 1

データはこんな感じで、4番目のデータからプロットしていくとだんだん二項分布に近づいていく様がみてとれる。

beta

15112008 chemoinformatics bioinformatics PRML

Dirichlet Process

chemoinformaticsにも使えそうなので色々読んでみている。

Gaussian processes deﬁne a distribution over functions
Dirichlet processes deﬁne a distribution over distributions

ぼんやりとした入門のそのまた入門の入り口ぐらいには立ったかなって感じ。CRPで遺伝子発現のクラスタリングをやっている論文があったので読む。

ディリクレ分布に関してはこの本見た。

パターン認識と機械学習上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 6,825 ()
通常24時間以内に発送

12112008 R PRML

ICAからモデルベースのクラスタリング

昨日気になったので、とりあえずどんな感じか確かめようと。

> library("fastICA")
> library("mclust")
> data("iris")
> b <- fastICA(iris[1:4],2)
> mc <- Mclust(b$S,G=3,modelNames="VVV")
> plot(mc,b$S)

混合分布はクラスタリングの本にも載っているが、PRMLの下巻のほうがK-meansからEM,混合モデルの導入の流れがスムーズで分かりやすかったかな。

Rで学ぶクラスタ解析
新納浩幸
オーム社 / 3360円 ( 2007-11 )

パターン認識と機械学習下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ?円 ( 2008-07-11 )

About

もう5年目(wishlistありマス♡)
最近はPythonとDeepLearning
日本酒自粛中
ドラムンベースからミニマルまで
ポケモンGOゆるめ