出典がちょっとどこだかわすれたが。
- PCA 分散の大きな成分を抽出
- ICA 非正規性を最大にする成分を抽出
独立って、直交しないといけないんじゃないかなんて思っていたがこの資料みて納得。
その上で主成分分析、独立成分分析を読んだらさくっと理解できた。
> data("iris")
> a <- prcomp(iris[1:4])
>biplot()
> library("fastICA")
> data("iris")
> b <- fastICA(iris[1:4],2)
> plot(b$S)
ある種のデータを二次元のプロットとして見たい場合、PCAだと変に鎖上になってしまうものもICAだともうちょっと広がって見えてくれるかな。単にマップして見たいってだけだったらこういうやり方でもいいか。
あとPCAとかICAで次元を圧縮してから混合ガウス分布みたいなのでクラスタリングするってのはダメなのだろうか?