04 10 2006 chemoinformatics Tweet
知らんかった。Zincの drug-likeのsmiを使ってみた。200万件くらいあるので、結構でかめ。
babel druglike.smi -ofs
でインデックス作成する(結構かかる、athron3000+mem512Mで2時間くらい)。 インデックスが作成できたら、SMARTSで検索してみる。
$ babel druglike.fs -osmi -s 'N#Cc1cccc(F)c1C#N' 2 candidates from fingerprint search phase C(#N)c1c(c(c(c(c1C#N)F)F)F)F ZINC00155214 C(#N)c1c(c(c(c(c1C#N)F)F)N)F ZINC01507036 2 molecules converted
おお、7秒くらいで結果を返すので結構速い。
っていうか、babelのwikiみたら書いてあった。
babelはIDで検索はできないようだが、これはsmilesをsqliteにでも突っ込んでおけばいいので、Catalyst使えばお家いじり用のcompounds_dbが出来上がるな。