仕事のこと

来期は(なんというか希望とかそういうのは通らずに)、思っていた方向と逆のSBDDとかLBDDバリバリにアサインされそうな感じ。正直、鮫肌でチャクラを削られちゃった僕としては、もうそっち系のを練る気力は残ってませんよ?!

ProductName NARUTO-ナルト- DVD-BOX II 始動!木ノ葉崩し

アニプレックス / ¥ 22,575 (2009-02-25)
在庫あり。

一方、lispでバリバリコードを書いて覚えるという状況としてはナイスな気もするので、来期は職場でperl,pythonでコード書くのを止めてみよう。

あとは、クックブックも書かなきゃなぁ。

以下TODO

  • perlmolでRECAP実装
  • perlmol互換のopenbabelのperlラッパを用意する
  • CLOSでperlmol相当のものを創る。

あたりはやっときたい。

Molecular Descriptors for Chemoinformatics

これ欲しい

デジイチ買えるくらい高いけど

アップユーザー

製薬系のアプリケーションの充実っぷりはなかなか凄くて、コードなんかかけなくてもGUIのアプリをいじっているだけで労働ができる(not研究)。さらにアイコンをつなぎあわせるだけで、ワークフローが構成できるyahoo pipesみたいなのもあって、スクリプトなんて書く必要もなかったりとか。

そういう人達を(コードなんて書かないで)アプリケーションを専門に使うヒトという意味を込めてアップユーザーとか言ったりする。昔はアップユーザーにもノウハウが必要だったり経験がないとうまく結果を出せなかったりしたのでジョブとしても重要だったりしたんだけど、アプリケーション自体がどんどん賢くなってきててノウハウなんかなくてもボタン押すだけである程度だれでも使えるようになっている。で、そういう機械に使われる系の労働力はものすごいコモディテイ化してるよなぁっていう話はたまにされていたり。

上のエントリを見てふと思い出した。

Visualizing Data chapter 8 (Networks and Graphs)

8章はprocessingでネットワークを描いてく。とりあえず写経から。

sample

後半はanemoneをEclipseで。apacheのログがcombine形式でないので情報が足りないけど、ネットワークが成長していく様は見ていて楽しいし、飽きない。

sample

例えば創薬プロジェクトをanemoneみたいなのでビジュアライズしてみたいと考えている。先行化合物の類似性とか、薬理活性が変化していく様を直感的に捉えてみたいのだよなぁ。

ProductName ビジュアライジング・データ ―Processingによる情報視覚化手法
Ben Fry
オライリージャパン / ¥ 3,780 ()
通常3~5週間以内に発送

薬づくりの真実

CBI学会で出してる本がアマゾンで買えるようになったそうです

ProductName 薬づくりの真実
Tamas Bartfai,Graham V. Lees
CBI学会 / ¥ 3,000 ()
通常3~5週間以内に発送

僕は読んでないのだけど目次から察するに、アカデミックな本よりはリアルな感じで、 研究そのものというよりは、研究ビジネスといったものに興味がある場合に役立つかもしれない。

弱い紐帯の強さ的なアプローチのSAR

LeadOptimizationにおける合成戦略は基本的に新規な構造を追いかけるために、常にモデルを外れる傾向にある。だから精度が高すぎるQSARモデルはどうかなと思うことがあるし、あんまり最適構造にこだわんのもどうかな?なんて思ったりもする。また、あまりにも類似している構造が同じ様な活性を示すという情報は情報量的にあんまりだし、無駄に新規性を追求した結果、活性が残らなかったという状況もあれだ。

これってstrength of weak tiesに似ているんじゃないかと。つまり弱い紐帯のようなものをうまく探るのが、プロジェクトを先に進めるために必要なことのひとつであろうという仮説を立ててみた。

で、そういったネットワークを探索するのもなかなか楽しそうだ。

MCSを分解していってエッジを張って活性と類似度のバランスでエッジに重みをつけるっていうのはどうだろうか。構造は結構異なっているが適度に関連性があって活性があまり失われていないようなエッジはリードホッピングの道を指し示してはくれんじゃろか?

Dirichlet Process

chemoinformaticsにも使えそうなので色々読んでみている。

  • Gaussian processes define a distribution over functions
  • Dirichlet processes define a distribution over distributions

ぼんやりとした入門のそのまた入門の入り口ぐらいには立ったかなって感じ。CRPで遺伝子発現のクラスタリングをやっている論文があったので読む。

ディリクレ分布に関してはこの本見た。

ProductName パターン認識と機械学習 上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ¥ 6,825 ()
通常24時間以内に発送

Making Things Talk

予約した。

ProductName Making Things Talk -Arduinoで作る「会話」するモノたち
Tom Igoe
オライリージャパン / ¥ 3,990 ()
近日発売 予約可

これ読んで、arduino熱を高めてからハードをゲットするかどうか考えよう。

そういえばこの前の発表のときもう一枚おまけのスライドが残ってた。

Wiiコントローラーの加速度センサをつかってchemichoの変異の大きさをイベントドリブンで変えよう、、、

ProductName マツイ棒

長塩産業(株) / ()
通常24時間以内に発送

ドラフト汚さず、ラボ中(新規化合物で)ピカピカのメドケム棒というネタだったんですけどね。

セミナーで発表してきた

参加した皆様おつかれさまでした。

僕はというと、反応プログラミングを使った合成系人工無脳について、話させてもらいました。職場でトークしてもレスポンスが薄くて凹むのでこういう場は結構貴重だなぁと改めて。

  • つかみをコードでってのは、ダメでしょうと同僚に言われたのでやめた。
  • かわりにはてなーになりました!とかやってみた(謎)
  • Random Forestはみんな使っているのね。僕も実際のデータでなんか使ってみよう。
  • graphical modelingとかMCMCも探索系まで落ちてきそうな予感はするのでそっちもちゃんと押さえておかないとなぁ。
  • そういえばInSilicoSpectroはどうなんだろう?職場で流してみたら華麗にスルーされたままだったので聞いとけばよかった。

ProductName マルコフ連鎖モンテカルロ法 (統計ライブラリー)

朝倉書店 / ¥ 4,410 ()
通常24時間以内に発送

帰りにパラパラめくってみて欲しくなったんだけど、PRMLにも書いてあるからなぁ。

ProductName パターン認識と機械学習 下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ¥ 8,190 ()
通常24時間以内に発送

先にこっちだな。

追記 20081107

リサンプリングの話でrandom forestはどうかっていう話が出た時に、あーそれもありかなみたいなぁとその場では思ったのですが、よくよく考えたらブートストラップサンプルで標本が重複してしまうからそれをうまいこと回避できるのかなぁ?と。

なんかいい方法あるかなぁ。あとでもう少し考えてみよう。