01 11 2012 chemoinformatics Tweet
システム構築してるはずが、ここのところ分析多めというか120%
Canopy Clustering
ちょっと調べ物をしていてCanopy Clusteringという手法がmahoutに実装されていて面白そうだったので、論文読んでみた。
最初、自動で分割数選んでくれるのかーと勘違いしてたのだけど、荒くクラスタリングしてその後K-meansとかGreedy Agglomerative Clusteringに渡すだけらしい。分割数も荒いクラスタリングの中でAICとかBICを使って普通に求めるっぽい。
調べていく過程でIIR読めというような啓示があったが、積んであるのでそろそろ読もうかと思った。
Deep Learning
NNがアツいらしい。活性予測なんかでも好成績をおさめているらしいのでちょっと興味がわいた。
Merck Molecular Activity Challengeはなかなかいい試みだなぁ。日本でもどこかがやらないかなぁ(リーディングカンパニーとか)
特に興味を惹かれたのは
いくつかの分野、特に人の認識に関係するような画像、音声、言語といった分野では既存の技術を大きく超えている感があります。
ドラッグライクネスというモヤモヤ感満載の指標がRo5から置き換わるのであれば素晴らしいことかもしれない。