mol2psイイ!

ケムインフォマティクスに虚空投げで知ったmol2psを試した。綺麗!

mol2pstest

当分これに落ち着く予感。思えば色々試したもんだ。

長い道のりだった。

さて、mol2psはpascalで書かれてますよ。初pascalというわけで、バイナリを使わず、若気のいたりで? コンパイルしてみることにした。

まずfpcは普通にyumでいれる。

yum install fpc

fpcがインストールされたら早速コンパイル。

fpc mol2ps.pas -S2 -Xs -OG -Or -O2u -Op1

出来たmol2psを/usr/local/binにコピー(OKこんだけ)

ただ、これだとperlで使いにくいので、p2cでcコードに変換してからh2xs使ってPerlのモジュールに出来たらいいなぁってことで、やってみた。

p2cはpascalをcのコードに変換してくれるらしい。p2c-1.22-14.src.rpmとってきてリビルド

rpmbuild --rebuild p2c-1.22-14.src.rpm

するとp2cコマンドが出来るので

p2c mol2ps.pas

できたCのソースをいじってh2xsでperlのモジュールにすればいいはずなんだが、うまくCのコードに変換されなかった。どうもS2オプションがよくないらしい。

  -M<x>  set language mode to <x>
      -Mfpc      free pascal dialect (default)
      -Mobjfpc   switch some Delphi 2 extensions on
      -Mdelphi   tries to be Delphi compatible
  -S<x>  syntax options:
      -S2        same as -Mobjfpc

うーん4000行くらいか、、、、頑張ってperlに移植したい気もするなぁ。GSAPIなんかと組み合わせれば個人的に使い勝手のいいモジュールが出来そうな気がするんだが。

TってPerl派なのかな

Natureからの求人メールでおもろいもん見つけた。

募集職種と応募資格

分子設計、ケモインフォマティクス、バイオインフォマティクスに関する高度な専門知識・技術を有し、創薬研究に活用できる能力を有する方。プログラミング(Perl、JAVAなど)の経験があり

JAVAってのはありがちなんだけど、Perlまで入れてるのは現場の意向かな?

WWW::Search::DrugBank

ココ一週間の間に、Win32::PowerPointとかClass::Pluggableとか気になるモジュールが出てるのに、忙しくて触る暇がない。

WWW::Search::DrugBankもその中のひとつ。DrugBank へのアクセスを提供するモジュールらしい。メソッドっていうかRESULT FIELDSが一杯あるのはバイオインフォ系ありがちな。

僕このカラムの多さがいやなので、最近はすっかりClass::DBI::OracleとかClass::DBI::mysqlにはしるヨなぁ、、、、って、ダウンロードして、データベースに突っ込んでClass::DBIから触ればいいってことに気付いた。

OEChem

OEChem すごい。いまのとこPerlMolとかChemRubyよりも完成度高い感じがする。

PDB->XYZ->MOL2->SMILES->FASTA

とかファイル形式変えてっても最後にアミノ酸のFASTAが出力されたときには、びびった。

  • PDB->XYZ
  • 結合情報失われる
  • XYZ->MOL2
  • 結合情報再構築
  • MOL2->SMILES
  • 空間座標情報失われる
  • SMILES->FASTA
  • smilesからアミノ酸配列再構築

とかやっても、情報の欠損がおきないのは純粋にすごいと思う。まぁ、なんでもMOl2でセーブしとけはいいじゃんっていう突っ込みはおいといても。

あと、やっぱ海外だとRubyは少ないみたいでPythonがメジャーっぽい。どこもグラフのモデルなので、やっぱ描画ルーチンとドキュメントのしっかりしていて事例の多いところに流れるのかな。

そういやケミッチョ書きっぱなしのままだなぁ、そろそろまとめよう。

In silico Library Enumeration of Synthetically Feasible Libraries

みんな、似たようなこと考えるのね。

Cheminfostream: In silico Library Enumeration of Synthetically Feasible Libraries

“The core functionality to enumerate focused de novo type libraries in Oracle for a number of organic transformations is already available”

一応、Feasibleだったとしてもだ、、、

  • Sparseすぎ
  • ActiveCompoundあったとしても、活性相関探るために近傍のcompsつくるために手動かさなきゃならんので意外にrapidじゃない。H2Lの部分は速くならないってこと。
  • 造り過ぎ
  • 楽しいので、ついつい作りすぎてしまうネ。100,000 x 100,000で100億でしょ。さらに多段階合成なんかでもう一回かますともう大変。作るほうはドンドコドンドコ量産されるのでとっても嬉しいんだけど。

でも、大変なのはこっからだ。

どうやって絞込みすんの?

精度のいい予測つかって精度99.0%のモデルでも1億化合物残るね。Rule of X(5,3)だとかいっても、そもそも考慮されていたりするから、意外に減らせなかったり。そうすっと結構泣く。

調子にのって作りすぎなきゃよかった

みたいな。みんな若気の至り汁が出て困ったことがあるはず。

LoSBDD

SBDD(Structure Based Drug Design)の枠組みでLBDD(Ligand Based Drug Design)をやりたいなぁと最近考えている。つまり

LoSBDD(LBDD over SBDD)

ポピュラーな記述子の代わりに、複合体結晶構造の相互作用エネルギー(FMOみたいな量子化学計算したやつ)とかSIFtみたいな構造をよく反映した既述子やフィンガープリントを使ってQSARするのがおもろげ。

こっちはまぁなんとなく方向性は見えているからいいんだけど、ファーマコフォアみたいな薬理作用団な座標をうまいこと記述子に出来ないかナァっとふと思った。