01 12 2011 chemoinformatics bioinformatics Tweet
mol形式(sdf形式)のデータだと化合物の区切りが$$$$なので、化合物を追加したい場合は何も考えずにファイルに追記するだけでいいのでよいですね。
PDB形式のデータにsdf形式の化合物情報をマージしたいんだけど、いい方法ないかなぁと調べてみたところmol2でOKだった。
両方mol2形式にして
cat compounds.mol2 >> protein_data.mol2
ってやればマージできる。
どういう用途を想定しているかっていうと
ある適当な部分構造(substructure)を持っている化合物の複合体結晶構造に、同じsubstructureをもつ別の化合物のコンフォマーを発生しつつ複合体のsubstructureの座標でalignする
つまり
- obconformerでコンフォマーを発生
- 複合体結晶構造のリガンドの部分構造を使ってobfitでコンフォマーをアライン
- 一つのファイルにまとめてドッキングモデル完成
みたいなことをやりたかったわけです。こういうのはファイルが2つに分かれてるとユーザーのヒトとか使いにくいしどういう計算したのかわからなくなっちゃうからね。
Bioinformatics Programming Using Python
Mitchell L. Model
Oreilly & Associates Inc / 5119円 ( 2009-12-23 )
Mitchell L. Model
Oreilly & Associates Inc / 5119円 ( 2009-12-23 )