薬づくりの真実

CBI学会で出してる本がアマゾンで買えるようになったそうです

ProductName 薬づくりの真実
Tamas Bartfai,Graham V. Lees
CBI学会 / ¥ 3,000 ()
通常3~5週間以内に発送

僕は読んでないのだけど目次から察するに、アカデミックな本よりはリアルな感じで、 研究そのものというよりは、研究ビジネスといったものに興味がある場合に役立つかもしれない。

弱い紐帯の強さ的なアプローチのSAR

LeadOptimizationにおける合成戦略は基本的に新規な構造を追いかけるために、常にモデルを外れる傾向にある。だから精度が高すぎるQSARモデルはどうかなと思うことがあるし、あんまり最適構造にこだわんのもどうかな?なんて思ったりもする。また、あまりにも類似している構造が同じ様な活性を示すという情報は情報量的にあんまりだし、無駄に新規性を追求した結果、活性が残らなかったという状況もあれだ。

これってstrength of weak tiesに似ているんじゃないかと。つまり弱い紐帯のようなものをうまく探るのが、プロジェクトを先に進めるために必要なことのひとつであろうという仮説を立ててみた。

で、そういったネットワークを探索するのもなかなか楽しそうだ。

MCSを分解していってエッジを張って活性と類似度のバランスでエッジに重みをつけるっていうのはどうだろうか。構造は結構異なっているが適度に関連性があって活性があまり失われていないようなエッジはリードホッピングの道を指し示してはくれんじゃろか?

Dirichlet Process

chemoinformaticsにも使えそうなので色々読んでみている。

  • Gaussian processes define a distribution over functions
  • Dirichlet processes define a distribution over distributions

ぼんやりとした入門のそのまた入門の入り口ぐらいには立ったかなって感じ。CRPで遺伝子発現のクラスタリングをやっている論文があったので読む。

ディリクレ分布に関してはこの本見た。

ProductName パターン認識と機械学習 上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ¥ 6,825 ()
通常24時間以内に発送

Making Things Talk

予約した。

ProductName Making Things Talk -Arduinoで作る「会話」するモノたち
Tom Igoe
オライリージャパン / ¥ 3,990 ()
近日発売 予約可

これ読んで、arduino熱を高めてからハードをゲットするかどうか考えよう。

そういえばこの前の発表のときもう一枚おまけのスライドが残ってた。

Wiiコントローラーの加速度センサをつかってchemichoの変異の大きさをイベントドリブンで変えよう、、、

ProductName マツイ棒

長塩産業(株) / ()
通常24時間以内に発送

ドラフト汚さず、ラボ中(新規化合物で)ピカピカのメドケム棒というネタだったんですけどね。

セミナーで発表してきた

参加した皆様おつかれさまでした。

僕はというと、反応プログラミングを使った合成系人工無脳について、話させてもらいました。職場でトークしてもレスポンスが薄くて凹むのでこういう場は結構貴重だなぁと改めて。

  • つかみをコードでってのは、ダメでしょうと同僚に言われたのでやめた。
  • かわりにはてなーになりました!とかやってみた(謎)
  • Random Forestはみんな使っているのね。僕も実際のデータでなんか使ってみよう。
  • graphical modelingとかMCMCも探索系まで落ちてきそうな予感はするのでそっちもちゃんと押さえておかないとなぁ。
  • そういえばInSilicoSpectroはどうなんだろう?職場で流してみたら華麗にスルーされたままだったので聞いとけばよかった。

ProductName マルコフ連鎖モンテカルロ法 (統計ライブラリー)

朝倉書店 / ¥ 4,410 ()
通常24時間以内に発送

帰りにパラパラめくってみて欲しくなったんだけど、PRMLにも書いてあるからなぁ。

ProductName パターン認識と機械学習 下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ¥ 8,190 ()
通常24時間以内に発送

先にこっちだな。

追記 20081107

リサンプリングの話でrandom forestはどうかっていう話が出た時に、あーそれもありかなみたいなぁとその場では思ったのですが、よくよく考えたらブートストラップサンプルで標本が重複してしまうからそれをうまいこと回避できるのかなぁ?と。

なんかいい方法あるかなぁ。あとでもう少し考えてみよう。

「最短経路の本」読んだ

グラフ版数学ガール的な本。ただし、数式はほとんど出てこなく、さくさく読めてお薦め。

ProductName 最短経路の本
R. ブランデンベルク
シュプリンガー・ジャパン株式会社 / ?円 ( 2007-12-13 )


「ダイクストラのアルゴリズム」に始まり、最小全域木と最短経路木の話があって、greedy algorithmとして「クルスカルのアルゴリズム」へ。

このあたりで、マトロイドが出てきたんだが、ここはいまいち理解できなかった。

さらに、オイラー小路、オイラー閉路の説明があって、「チュゴクの郵便配達員問題のアルゴリズム」でだんだん面白くなってきて、巡回セールスマン問題へ至る。

ここで、「1-木」とかいう話が出てきてちと悩む。「クリストファイズのアルゴリズム」やヒューリスティックな解放をいくつか通って、多面体組み合わせ論へ。ただし、これはイメージだけつかませるような内容になっていて、ここでこの本は終了。

GASTONとかgSpanに至には次にどんな本読めばいいんだろうかのう。とりあえずAmazonをみてたら面白そうなの見つけた。

  • an introduction to fragment based drug discovery, why using fragments is a more efficient process than predominant models, and what it means to have a successful FBDD effort.
  • setting up an FBDD project
  • library building and production
  • NMR in fragment screening and follow up
  • application of protein-ligand NOE matching to the rapid evaluation of fragment binding poses
  • target immobilized NMR screening: validation and extension to membrane proteins
  • in situ fragment-based medicinal chemistry: screening by mass spectrometry
  • computational approaches to fragment and substructure discovery and evaluation
  • virtual fragment scanning: current trends, applications and web based tools
  • fragment-based lead discovery using covalent capture methods
  • case study from industry: the identification of high affinity beta-secretase inhibitors using fragment-based lead generation

広く浅くな内容な気がするがちょっと気になる。

GASTON

GASTONが分からなくてお悩み中。参考文献とかから読まないとやっぱダメな感じ。

TODO:ここから追いかける

そのながれで、最短経路の本も読んでおく

ProductName 最短経路の本
R. ブランデンベルク,P. グリッツマン
シュプリンガー・ジャパン株式会社 / ¥ 3,675 ()
通常24時間以内に発送

当分日本酒も無しだなぁ、ということで、昨日吞みきった高砂で当分は家吞み断ちだ。

1225542968

中国茶用の茶器出したら、U隊長に「珍しいねー(なんかあったの?)」なんて言われてしまった。

「インタラクションデザインの教科書」を読んだ

今の仕事で、data preparationのための効率的な仕組み(インタラクティブなサービス)が必要だろうなぁと感じているので、8章のサービスのデザインが参考になった。

ProductName インタラクションデザインの教科書 (DESIGN IT! BOOKS)
Dan Saffer
毎日コミュニケーションズ / ¥ 2,940 ()
通常24時間以内に発送

デザイニング・インターフェースも併せて読むとおもしろい。

ProductName デザイニング・インターフェース ―パターンによる実践的インタラクションデザイン
Jenifer Tidwell
オライリー・ジャパン / ¥ 3,990 ()
通常24時間以内に発送

pubchemのクラスタリングの結果をcytoscapeで見てみた

pubchemはクラスタリングの結果をgml形式でダウンロードできるので、それをcytoscapeで読み込んで解析することができる。早速データをとってくる。benzothioleで検索すると大体3000件くらいヒットするのでこれをクラスタリングしたものをgmlでダウンロードして、cytoscapeで読み込んでみた。

pubchem

適当に描かせて眺めてみる。なんかネットワークっぽくなってますの。

cytoscape

さらに、ズームしてみる。

cytoscape zoom

うーん、クラスタリングの結果を見てもちょっと面白くない。むしろ部分構造(MCS:Maximum Common Substructure)から構築したネットワークのほうがわかりやすいだろうな。

あとは、合成の時系列でネットワークをつくればいいと思うが、その場合、元々参考にした化合物の構造への情報をケミストから聞かなきゃいけないのでちょっとめんどいなぁ。

ということはpatentか?あれは先行技術の特許番号ついてたはずだからあれでネットワーク構築すればいいのか。これだったら、描いてみておもしろそう。

TODO: 奇麗な絵が描けるようにcydocなどを参考にちょっと勉強しとく

Chemistry::Mol

Chemistry::Molでちょっとはまった。

Can't call method "symbol" on an undefined value

というエラーでつまづいた。

my $mol2 = $mol->clone;

Makes a copy of a molecule. Note that this is a deep copy; if your molecule has a pointer to the rest of the universe, the entire universe will be cloned! my $mol2 = $mol->safe_clone;

Like clone, it makes a deep copy of a molecule. The difference is that the copy is not "exact" in that new molecule and its atoms and bonds get assigned new IDs. This makes it safe to combine cloned molecules. For example, this is an error:

    # XXX don't try this at home!
    my $mol2 = Chemistry::Mol->combine($mol1, $mol1);
    # the atoms in $mol1 will clash

But this is ok:

    # the "safe clone" of $mol1 will have new IDs
    my $mol2 = Chemistry::Mol->combine($mol1, $mol1->safe_clone);