Drkcore

アップユーザー

製薬系のアプリケーションの充実っぷりはなかなか凄くて、コードなんかかけなくてもGUIのアプリをいじっているだけで労働ができる(not研究)。さらにアイコンをつなぎあわせるだけで、ワークフローが構成できるyahoo pipesみたいなのもあって、スクリプトなんて書く必要もなかったりとか。

そういう人達を（コードなんて書かないで）アプリケーションを専門に使うヒトという意味を込めてアップユーザーとか言ったりする。昔はアップユーザーにもノウハウが必要だったり経験がないとうまく結果を出せなかったりしたのでジョブとしても重要だったりしたんだけど、アプリケーション自体がどんどん賢くなってきててノウハウなんかなくてもボタン押すだけである程度だれでも使えるようになっている。で、そういう機械に使われる系の労働力はものすごいコモディテイ化してるよなぁっていう話はたまにされていたり。

http://www.kt.rim.or.jp/%7ekbk/zakkicho/09/zakkicho0901b.html#D20090119-6

ときどきの雑記帖 i戦士篇 2009年1月(中旬) via kwout

上のエントリを見てふと思い出した。

11122008 chemoinformatics processing

Visualizing Data　chapter 8 (Networks and Graphs)

8章はprocessingでネットワークを描いてく。とりあえず写経から。

sample

後半はanemoneをEclipseで。apacheのログがcombine形式でないので情報が足りないけど、ネットワークが成長していく様は見ていて楽しいし、飽きない。

sample

例えば創薬プロジェクトをanemoneみたいなのでビジュアライズしてみたいと考えている。先行化合物の類似性とか、薬理活性が変化していく様を直感的に捉えてみたいのだよなぁ。

ビジュアライジング・データ ―Processingによる情報視覚化手法
Ben Fry
オライリージャパン / ￥ 3,780 ()
通常3～5週間以内に発送

26112008 chemoinformatics

薬づくりの真実

CBI学会で出してる本がアマゾンで買えるようになったそうです

薬づくりの真実
Tamas Bartfai,Graham V. Lees
CBI学会 / ￥ 3,000 ()
通常3～5週間以内に発送

僕は読んでないのだけど目次から察するに、アカデミックな本よりはリアルな感じで、研究そのものというよりは、研究ビジネスといったものに興味がある場合に役立つかもしれない。

18112008 chemoinformatics

弱い紐帯の強さ的なアプローチのSAR

LeadOptimizationにおける合成戦略は基本的に新規な構造を追いかけるために、常にモデルを外れる傾向にある。だから精度が高すぎるQSARモデルはどうかなと思うことがあるし、あんまり最適構造にこだわんのもどうかな?なんて思ったりもする。また、あまりにも類似している構造が同じ様な活性を示すという情報は情報量的にあんまりだし、無駄に新規性を追求した結果、活性が残らなかったという状況もあれだ。

これってstrength of weak tiesに似ているんじゃないかと。つまり弱い紐帯のようなものをうまく探るのが、プロジェクトを先に進めるために必要なことのひとつであろうという仮説を立ててみた。

で、そういったネットワークを探索するのもなかなか楽しそうだ。

MCSを分解していってエッジを張って活性と類似度のバランスでエッジに重みをつけるっていうのはどうだろうか。構造は結構異なっているが適度に関連性があって活性があまり失われていないようなエッジはリードホッピングの道を指し示してはくれんじゃろか？

15112008 chemoinformatics bioinformatics PRML

Dirichlet Process

chemoinformaticsにも使えそうなので色々読んでみている。

Gaussian processes deﬁne a distribution over functions
Dirichlet processes deﬁne a distribution over distributions

ぼんやりとした入門のそのまた入門の入り口ぐらいには立ったかなって感じ。CRPで遺伝子発現のクラスタリングをやっている論文があったので読む。

ディリクレ分布に関してはこの本見た。

パターン認識と機械学習上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 6,825 ()
通常24時間以内に発送

09112008 chemoinformatics Arduino

Making Things Talk

予約した。

Making Things Talk -Arduinoで作る「会話」するモノたち
Tom Igoe
オライリージャパン / ￥ 3,990 ()
近日発売　予約可

これ読んで、arduino熱を高めてからハードをゲットするかどうか考えよう。

そういえばこの前の発表のときもう一枚おまけのスライドが残ってた。

Wiiコントローラーの加速度センサをつかってchemichoの変異の大きさをイベントドリブンで変えよう、、、

マツイ棒

長塩産業（株） / ()
通常24時間以内に発送

ドラフト汚さず、ラボ中(新規化合物で)ピカピカのメドケム棒というネタだったんですけどね。

08112008 chemoinformatics work

セミナーで発表してきた

参加した皆様おつかれさまでした。

僕はというと、反応プログラミングを使った合成系人工無脳について、話させてもらいました。職場でトークしてもレスポンスが薄くて凹むのでこういう場は結構貴重だなぁと改めて。

つかみをコードでってのは、ダメでしょうと同僚に言われたのでやめた。
かわりにはてなーになりました！とかやってみた（謎）
Random Forestはみんな使っているのね。僕も実際のデータでなんか使ってみよう。
graphical modelingとかMCMCも探索系まで落ちてきそうな予感はするのでそっちもちゃんと押さえておかないとなぁ。
そういえばInSilicoSpectroはどうなんだろう?職場で流してみたら華麗にスルーされたままだったので聞いとけばよかった。

マルコフ連鎖モンテカルロ法 (統計ライブラリー)

朝倉書店 / ￥ 4,410 ()
通常24時間以内に発送

帰りにパラパラめくってみて欲しくなったんだけど、PRMLにも書いてあるからなぁ。

パターン認識と機械学習下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ￥ 8,190 ()
通常24時間以内に発送

先にこっちだな。

追記 20081107

リサンプリングの話でrandom forestはどうかっていう話が出た時に、あーそれもありかなみたいなぁとその場では思ったのですが、よくよく考えたらブートストラップサンプルで標本が重複してしまうからそれをうまいこと回避できるのかなぁ?と。

なんかいい方法あるかなぁ。あとでもう少し考えてみよう。

02112008 chemoinformatics life

「最短経路の本」読んだ

グラフ版数学ガール的な本。ただし、数式はほとんど出てこなく、さくさく読めてお薦め。

最短経路の本
R. ブランデンベルク
シュプリンガー・ジャパン株式会社 / ?円 ( 2007-12-13 )

「ダイクストラのアルゴリズム」に始まり、最小全域木と最短経路木の話があって、greedy algorithmとして「クルスカルのアルゴリズム」へ。

このあたりで、マトロイドが出てきたんだが、ここはいまいち理解できなかった。

さらに、オイラー小路、オイラー閉路の説明があって、「チュゴクの郵便配達員問題のアルゴリズム」でだんだん面白くなってきて、巡回セールスマン問題へ至る。

ここで、「1-木」とかいう話が出てきてちと悩む。「クリストファイズのアルゴリズム」やヒューリスティックな解放をいくつか通って、多面体組み合わせ論へ。ただし、これはイメージだけつかませるような内容になっていて、ここでこの本は終了。

GASTONとかgSpanに至には次にどんな本読めばいいんだろうかのう。とりあえずAmazonをみてたら面白そうなの見つけた。

Fragment-Based Drug Discovery: A Practical Approach

Wiley / 20323円 ( 2008-12-08 )

an introduction to fragment based drug discovery, why using fragments is a more efficient process than predominant models, and what it means to have a successful FBDD effort.
setting up an FBDD project
library building and production
NMR in fragment screening and follow up
application of protein-ligand NOE matching to the rapid evaluation of fragment binding poses
target immobilized NMR screening: validation and extension to membrane proteins
in situ fragment-based medicinal chemistry: screening by mass spectrometry
computational approaches to fragment and substructure discovery and evaluation
virtual fragment scanning: current trends, applications and web based tools
fragment-based lead discovery using covalent capture methods
case study from industry: the identification of high affinity beta-secretase inhibitors using fragment-based lead generation