22032008 chemoinformatics
ふむ。でもあんまり便利感がないなー。っだって、長い番号打ち込まないといけないんでしょ?
構造式のgooglesuggestみたいなのがあればいいんだけどね。
22032008 chemoinformatics
ふむ。でもあんまり便利感がないなー。っだって、長い番号打ち込まないといけないんでしょ?
構造式のgooglesuggestみたいなのがあればいいんだけどね。
18032008 chemoinformatics perl bioinformatics
文献はpdfを自作のイントラソーシャルブックマークサービスっぽいのを使って管理しているのだけど、pubmedにのるよりもペーパーの方が早かったりすることのほうが多く、pmidをつけることが出来なくてもどかしい思いをしてばかりいる。
use strict;
use warnings;
use CAM::PDF;
my $pdfname = $ARGV[0];
my $pdf = CAM::PDF->new($pdfname);
my $page1 = $pdf->getPageContent(1);
my ($result) = $page1 =~ m!\d+\.\d+\/.+?(?=\))!gx;
print $result if $result;
抽出したdoiをeutilsに問い合わせて、あとは適度な塩加減を加えつつゴニョルとよさげ。
で、そのソーシャルブックマークサービスはpmidをプライマリキーにしてるもんだから始末に負えない、というかそのうち、匠的にリフォームする気概で、今日もだましだまし使った。
09012008 chemoinformatics
SBDD(Structure-Based Drug Design)って、結局モデルの精度にあわせてMDとかMOとか視点を変えなきゃいけないからマルチパラダイムだよなと思った。
あとそろそろ単なるMO計算も飽きてきたので、今年はMO計算とQSARをうまいこと組み合わせた手法とか編み出してみたい。あと、ケミストの合成ロジックをエミュレートするような無限ストリーム(仮)を実装したい。
あーでも、他のことに興味がいっちゃうんだよなー。
15122007 chemoinformatics perl MAWP
さわりだけなので、さらっとしている。
ちゃんと学びたければC++とかの本を探したほうがよいのかな?pymolとかAvogadroのソースを読むのがいいのかもしれんなぁ。
ドッキングシミュレーションとか色々気に入らない部分があるので、手を加えたい部分があったりとか、Caverみたいなの自分で書いてみたかったりするんだけどそういう書籍はないもんかな。
06122007 chemoinformatics perl MAWP
Graphなどを使ってグラフ
なんかをコードを追いながら理解することができた。Primはこっちの説明が分かりやすくてお奨め。
Pythonだとnetworkxがあってこっちは視覚化できてよさげ。
chemoinformaticsでグラフは化合物の構造表現なんかでよく使う。というか、売り物ツールが勝手にやってくれるのであまりちゃんと理解してなかったんだけど、アルゴリズムしらないで理解しないで使うと痛い目見たりとか、中身がよく分からんので痒いところに手が届かない感じが嫌だなと思うことがあったので、MAWP読んで基本的なところをちょっと押さえた気になった。
そういえば、gSpanなんかで、部分構造いじってみたいと思ってたんだけど、放ってあるなぁ。
04122007 Catalyst chemoinformatics perl bioinformatics
Catalyst + Open Flash Chart: Fancy graphs with minimal fuss
こんなのが10分程度で作れてすごいいい感じ。昔作った遺伝子発現のやつをこっちにかえるといいかもしれん。
ちょっとしたもの作るにはChart::OFCもいいですな。
03122007 chemoinformatics
20112007 chemoinformatics plagger
リンク切れのとこを消して、Chemical blogspaceとChemSpider Blogを追加した。
が、ちょっとインフォマティクスと関係なさげなのが混じってるようなのであとで調整するかもしれん。あと全文とってこなあかんな。
latest postは全文じゃないのと、ケミカルなのではずした。ケモインフォっぽいフィードを選んで追加することにした。
17112007 chemoinformatics
InChiのGoogle TechTalksが出てたので週末にでもとためておいて今日見た。
InChIはちょっとめんどくさそうな表記法で大体SMILESと似たような情報量(座標が欠損する)なのに、大きい分子だとすぐ文字数が大きくなって困るので、SMILESでいいんじゃないかなと敬遠してたけど。あと、特に名前の一意性にこだわる大きな理由がなかったってのもある。
でも、プレゼンの中で語られてたInChiKeyっていう25文字のハッシュで構造をあらわすのはいいかも。RESTfulなサービス作る場合に便利じゃんと思ったら、既にDepth-Firstでふれられてた