Drkcore

04 03 2010 chemoinformatics Tweet

化合物情報をTokyo Cabinetで管理してみる

単にIDをキーにしてsdf呼び出すだけだったらKVSで良くね?と思ったところ、そういえばTokyoCabinetのPythonバインディングがあることを思い出したので、ちょっと試してみた。

データはこの時に落としておいたsdf

import pybel
import pytc

sdffile = "pc_sample.sdf"
db = pytc.HDB('compounds.db', pytc.HDBOWRITER | pytc.HDBOCREAT)
mols = pybel.readfile("mol",sdffile)

for mol in mols:
    title = mol.OBMol.GetTitle() 
    db[title] = mol.write("mol")

100万化合物くらいなら全部メモリに載せられそうな感じ。そしたら速いよねー、CouchDBも気になってきた。

ProductName Software Design ( ソフトウェアデザイン ) 2010年 02月号 [雑誌]

技術評論社 / ¥ 970 ()


About

  • もう5年目(wishlistありマス♡)
  • 最近はPythonとDeepLearning
  • 日本酒自粛中
  • ドラムンベースからミニマルまで
  • ポケモンGOゆるめ

Tag

Python Deep Learning javascript chemoinformatics Emacs sake and more...

Ad

© kzfm 2003-2021