Drkcore

01 11 2012 chemoinformatics Tweet

Canopy ClusteringとDeep Learning

システム構築してるはずが、ここのところ分析多めというか120%

Canopy Clustering

ちょっと調べ物をしていてCanopy Clusteringという手法がmahoutに実装されていて面白そうだったので、論文読んでみた。

最初、自動で分割数選んでくれるのかーと勘違いしてたのだけど、荒くクラスタリングしてその後K-meansとかGreedy Agglomerative Clusteringに渡すだけらしい。分割数も荒いクラスタリングの中でAICとかBICを使って普通に求めるっぽい。

ProductName Mahoutイン・アクション
Sean Owen
オライリージャパン / 4200円 ( 2012-10-26 )


調べていく過程でIIR読めというような啓示があったが、積んであるのでそろそろ読もうかと思った。

ProductName 情報検索の基礎
Christopher D.Manning
共立出版 / 8400円 ( 2012-06-23 )


Deep Learning

NNがアツいらしい。活性予測なんかでも好成績をおさめているらしいのでちょっと興味がわいた。

Merck Molecular Activity Challengeはなかなかいい試みだなぁ。日本でもどこかがやらないかなぁ(リーディングカンパニーとか)

特に興味を惹かれたのは

いくつかの分野、特に人の認識に関係するような画像、音声、言語といった分野では既存の技術を大きく超えている感があります。

ドラッグライクネスというモヤモヤ感満載の指標がRo5から置き換わるのであれば素晴らしいことかもしれない。

About

  • もう5年目(wishlistありマス♡)
  • 最近はPythonとDeepLearning
  • 日本酒自粛中
  • ドラムンベースからミニマルまで
  • ポケモンGOゆるめ

Tag

Python Deep Learning javascript chemoinformatics Emacs sake and more...

Ad

© kzfm 2003-2021