アップユーザー

製薬系のアプリケーションの充実っぷりはなかなか凄くて、コードなんかかけなくてもGUIのアプリをいじっているだけで労働ができる(not研究)。さらにアイコンをつなぎあわせるだけで、ワークフローが構成できるyahoo pipesみたいなのもあって、スクリプトなんて書く必要もなかったりとか。

そういう人達を(コードなんて書かないで)アプリケーションを専門に使うヒトという意味を込めてアップユーザーとか言ったりする。昔はアップユーザーにもノウハウが必要だったり経験がないとうまく結果を出せなかったりしたのでジョブとしても重要だったりしたんだけど、アプリケーション自体がどんどん賢くなってきててノウハウなんかなくてもボタン押すだけである程度だれでも使えるようになっている。で、そういう機械に使われる系の労働力はものすごいコモディテイ化してるよなぁっていう話はたまにされていたり。

上のエントリを見てふと思い出した。

Visualizing Data chapter 8 (Networks and Graphs)

8章はprocessingでネットワークを描いてく。とりあえず写経から。

sample

後半はanemoneをEclipseで。apacheのログがcombine形式でないので情報が足りないけど、ネットワークが成長していく様は見ていて楽しいし、飽きない。

sample

例えば創薬プロジェクトをanemoneみたいなのでビジュアライズしてみたいと考えている。先行化合物の類似性とか、薬理活性が変化していく様を直感的に捉えてみたいのだよなぁ。

ProductName ビジュアライジング・データ ―Processingによる情報視覚化手法
Ben Fry
オライリージャパン / ¥ 3,780 ()
通常3~5週間以内に発送

薬づくりの真実

CBI学会で出してる本がアマゾンで買えるようになったそうです

ProductName 薬づくりの真実
Tamas Bartfai,Graham V. Lees
CBI学会 / ¥ 3,000 ()
通常3~5週間以内に発送

僕は読んでないのだけど目次から察するに、アカデミックな本よりはリアルな感じで、 研究そのものというよりは、研究ビジネスといったものに興味がある場合に役立つかもしれない。

弱い紐帯の強さ的なアプローチのSAR

LeadOptimizationにおける合成戦略は基本的に新規な構造を追いかけるために、常にモデルを外れる傾向にある。だから精度が高すぎるQSARモデルはどうかなと思うことがあるし、あんまり最適構造にこだわんのもどうかな?なんて思ったりもする。また、あまりにも類似している構造が同じ様な活性を示すという情報は情報量的にあんまりだし、無駄に新規性を追求した結果、活性が残らなかったという状況もあれだ。

これってstrength of weak tiesに似ているんじゃないかと。つまり弱い紐帯のようなものをうまく探るのが、プロジェクトを先に進めるために必要なことのひとつであろうという仮説を立ててみた。

で、そういったネットワークを探索するのもなかなか楽しそうだ。

MCSを分解していってエッジを張って活性と類似度のバランスでエッジに重みをつけるっていうのはどうだろうか。構造は結構異なっているが適度に関連性があって活性があまり失われていないようなエッジはリードホッピングの道を指し示してはくれんじゃろか?

Dirichlet Process

chemoinformaticsにも使えそうなので色々読んでみている。

  • Gaussian processes define a distribution over functions
  • Dirichlet processes define a distribution over distributions

ぼんやりとした入門のそのまた入門の入り口ぐらいには立ったかなって感じ。CRPで遺伝子発現のクラスタリングをやっている論文があったので読む。

ディリクレ分布に関してはこの本見た。

ProductName パターン認識と機械学習 上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ¥ 6,825 ()
通常24時間以内に発送

Making Things Talk

予約した。

ProductName Making Things Talk -Arduinoで作る「会話」するモノたち
Tom Igoe
オライリージャパン / ¥ 3,990 ()
近日発売 予約可

これ読んで、arduino熱を高めてからハードをゲットするかどうか考えよう。

そういえばこの前の発表のときもう一枚おまけのスライドが残ってた。

Wiiコントローラーの加速度センサをつかってchemichoの変異の大きさをイベントドリブンで変えよう、、、

ProductName マツイ棒

長塩産業(株) / ()
通常24時間以内に発送

ドラフト汚さず、ラボ中(新規化合物で)ピカピカのメドケム棒というネタだったんですけどね。

セミナーで発表してきた

参加した皆様おつかれさまでした。

僕はというと、反応プログラミングを使った合成系人工無脳について、話させてもらいました。職場でトークしてもレスポンスが薄くて凹むのでこういう場は結構貴重だなぁと改めて。

  • つかみをコードでってのは、ダメでしょうと同僚に言われたのでやめた。
  • かわりにはてなーになりました!とかやってみた(謎)
  • Random Forestはみんな使っているのね。僕も実際のデータでなんか使ってみよう。
  • graphical modelingとかMCMCも探索系まで落ちてきそうな予感はするのでそっちもちゃんと押さえておかないとなぁ。
  • そういえばInSilicoSpectroはどうなんだろう?職場で流してみたら華麗にスルーされたままだったので聞いとけばよかった。

ProductName マルコフ連鎖モンテカルロ法 (統計ライブラリー)

朝倉書店 / ¥ 4,410 ()
通常24時間以内に発送

帰りにパラパラめくってみて欲しくなったんだけど、PRMLにも書いてあるからなぁ。

ProductName パターン認識と機械学習 下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ¥ 8,190 ()
通常24時間以内に発送

先にこっちだな。

追記 20081107

リサンプリングの話でrandom forestはどうかっていう話が出た時に、あーそれもありかなみたいなぁとその場では思ったのですが、よくよく考えたらブートストラップサンプルで標本が重複してしまうからそれをうまいこと回避できるのかなぁ?と。

なんかいい方法あるかなぁ。あとでもう少し考えてみよう。

「最短経路の本」読んだ

グラフ版数学ガール的な本。ただし、数式はほとんど出てこなく、さくさく読めてお薦め。

ProductName 最短経路の本
R. ブランデンベルク
シュプリンガー・ジャパン株式会社 / ?円 ( 2007-12-13 )


「ダイクストラのアルゴリズム」に始まり、最小全域木と最短経路木の話があって、greedy algorithmとして「クルスカルのアルゴリズム」へ。

このあたりで、マトロイドが出てきたんだが、ここはいまいち理解できなかった。

さらに、オイラー小路、オイラー閉路の説明があって、「チュゴクの郵便配達員問題のアルゴリズム」でだんだん面白くなってきて、巡回セールスマン問題へ至る。

ここで、「1-木」とかいう話が出てきてちと悩む。「クリストファイズのアルゴリズム」やヒューリスティックな解放をいくつか通って、多面体組み合わせ論へ。ただし、これはイメージだけつかませるような内容になっていて、ここでこの本は終了。

GASTONとかgSpanに至には次にどんな本読めばいいんだろうかのう。とりあえずAmazonをみてたら面白そうなの見つけた。

  • an introduction to fragment based drug discovery, why using fragments is a more efficient process than predominant models, and what it means to have a successful FBDD effort.
  • setting up an FBDD project
  • library building and production
  • NMR in fragment screening and follow up
  • application of protein-ligand NOE matching to the rapid evaluation of fragment binding poses
  • target immobilized NMR screening: validation and extension to membrane proteins
  • in situ fragment-based medicinal chemistry: screening by mass spectrometry
  • computational approaches to fragment and substructure discovery and evaluation
  • virtual fragment scanning: current trends, applications and web based tools
  • fragment-based lead discovery using covalent capture methods
  • case study from industry: the identification of high affinity beta-secretase inhibitors using fragment-based lead generation

広く浅くな内容な気がするがちょっと気になる。

GASTON

GASTONが分からなくてお悩み中。参考文献とかから読まないとやっぱダメな感じ。

TODO:ここから追いかける

そのながれで、最短経路の本も読んでおく

ProductName 最短経路の本
R. ブランデンベルク,P. グリッツマン
シュプリンガー・ジャパン株式会社 / ¥ 3,675 ()
通常24時間以内に発送

当分日本酒も無しだなぁ、ということで、昨日吞みきった高砂で当分は家吞み断ちだ。

1225542968

中国茶用の茶器出したら、U隊長に「珍しいねー(なんかあったの?)」なんて言われてしまった。

「インタラクションデザインの教科書」を読んだ

今の仕事で、data preparationのための効率的な仕組み(インタラクティブなサービス)が必要だろうなぁと感じているので、8章のサービスのデザインが参考になった。

ProductName インタラクションデザインの教科書 (DESIGN IT! BOOKS)
Dan Saffer
毎日コミュニケーションズ / ¥ 2,940 ()
通常24時間以内に発送

デザイニング・インターフェースも併せて読むとおもしろい。

ProductName デザイニング・インターフェース ―パターンによる実践的インタラクションデザイン
Jenifer Tidwell
オライリー・ジャパン / ¥ 3,990 ()
通常24時間以内に発送