創薬プロジェクトのITSが欲しい

創薬プロジェクト用のIssue Tracking System(ITS)を探しているのだけど良いものがみつからない。

で、ないのなら作ってしまえということでとりあえずE-R図でも書こうかとnode.jsインストールしてwwwsqldesignerでやってみた

ITS

テーブルスキーマ出来たんであとはFlaskでサクサクつくればよろしい。

遺伝研の一般公開に行ってきた

先週行ってきた

1554988435

1554988415 1554988418 1554988420

よい

1554988425 1554988433

帰りは三島二日町まで降りてきて隣の田町駅の向かいにあるやんぐでラーメンを食べました。

1554988423

やごみ

チームから1人離脱するので、やごみで送別会的な飲みをしてきました。所属が離れるけど兼務でつながってるし同じフロアにいるので離れた感はゼロだけどねw

1554987357

湯豆腐とマグロ

1554987352 1554987364

アジと定番の磯辺揚げ

1554987355 1554987362

タコ唐揚げがつまむのに良かった

1554987359

今年もみんなで楽しく仕事をして良い成果を出せるといいなーと思います。

帰省してきた

5年ぶりくらいに餃子の街に帰省してきました。

1554634816 1554634820

子供達に餃子でも食べさせておくかとみんみんに寄った。

1554634813 1554634818

1554634822

子供が喜んでいたのでまぁ良しとしよう。

次の日は池袋のアニメイトに寄って、その後原宿をウロウロして、さらにお台場に移動して科学未来館で遊ぶという強行軍で疲れた。

ADMET Prediction with PotentialNet

うちのSlackオルタネティブのAI創薬絡みのチャンネルではArxivの機械学習新着が流れてくるようになっていて、たまに大きな桃がどんぶらこどんぶらこと流れてきては、中身をぶった切ってチャンネル参加者の皆でキャッキャウフフしてるわけです。

で、今回流れてきたのがStep Change Improvement in ADMET Prediction with PotentialNet Deep FeaturizationというPande先生のとこで開発したPotentialNetっていう手法をメルクのデータで検証したら調子良かった(良すぎ!)っていう論文です。

なんかfuとかmicrosomeのクリアランスとかADMEの予測がすごい改善していて期待度高いです。PotentialNetってのはGCNN(Neural FP)のとこにLeRUじゃなくてGRUつかうことで特徴量抽出を工夫しているようです。具体的になにがよろしくなってどういう特徴量が抽出されているのかイメージつかめないんですが、何が良くなるんでしょうね?

それから実装はPyTorchらしいけどGithubには上がってないようなので自分で再実装する必要ありそうだし、最初にAtomにどういう情報持たせるのかに工夫の余地はありそう。

PotentialNetはいずれdeepchemに取り入れられるのでしょうか?

深層学習も積みっぱなしだから読まないと、、、

ProductName 深層学習 (アスキードワンゴ)

ドワンゴ / ?円 ( 2018-08-27 )


AI in Medicinal Chemistry終わりました

参加者の皆様お疲れ様でした。楽しんでいただけて且つ何か得るものがあったのなら企画の甲斐があったなと思います。

それにしてもauto-DMTAやばかったですね。我々も頑張らないといけないなーと思いました。

さて、Thierryさんとはどういう経由で呼んだの?とかなり聞かれたのですが、実は去年のICCSでポスター出してたのでネホリンハホリンしたら次の日のexcursionで話しかけてきたので、「来年AI in Medicinal Chemistry企画してるんだけど興味ある?」って聞いたら「めっちゃある、呼ばれたら絶対行くで!」って、まぁそんな感じで決まりました。ICCSは面白い割に日本からの参加者はほぼいないので機会があれば参加すると良いと思います(3年ごとに開催)。

尚、ランチははん亭にしました。

1553687389

演者は懇親会は質問攻めにあってあまり食べられないので、皆で帰りに「にし乃」に寄りました。

1553687384 1553687387

美味しかった。

ADと特徴量

ちょっと質問されたので、py4chemoinformaticsの説明追加してみたんだけど自分の中で問題が整理されて良かった。

結局acivity cliffとかmagic methylってのはApplicability domainの問題ではなくて、特徴量の抽出のほうの問題なんですよね。グラフ類似性が実際の三次元の構造の類似性とは微妙に違うし、結合モードの類似性とかとも異なるのに、その類似性が活性の類似性と相関するという仮説そのものが正しくない可能性があるということを認識した上でモデルを作らんといかんよなと再認識させられた。

尚、CoMFAはぶつかって活性消失したという事実がないとモデリングできないし、ファーマコフォアの排除体積も同様。ドッキングのスコア関数はそれっぽい特徴表現だけど、粗すぎてネガティブスクリーニングにしか使えんけど、ファーマコフォア表現ってのが特徴量としては一番しっくりくるかなと言ったところ。

富士錦の蔵開き

今年も会社のみなさんと一緒に富士錦の蔵開きに行ってきました。

1552905738 1552905741

色々お話できて濃厚な時間を過ごしました。

1552905734 1552905736

帰りに富士宮をブラブラして、ヨコゼキ寄ったり、さの萬寄ったりできて良かった。

鶴松でやきとん

O2研に用があったので帰りに新橋の鶴松でやきとんしてきました。

1552742057

下田さん家の豚は山田さんが育てているそうです。山田さんの育てた豚はすこぶる美味しかった。

1552742054 1552742059

かしらとホルモン

1552742062 1552742064

色々食べだけど美味しかった。今度は馬力にも行きたい

ファーマコフォアについてのよもやま話

ファーマコフォアはもともとは、同じターゲットで複数の異なる骨格の薬剤とか開発化合物を3次元的に重ね合わせて共通の特徴を抽出するLBDD的な手法により推定されていてCatalystを使って計算するのが一般的だったように思います。

で、ファーマコフォアを作ろうとする話で触れられているように、ファーマコフォアをSBDDの側から解釈するとターゲット蛋白質でのポケット内で、強く相互作用している残基とリガンドの官能基の相互作用を見ていることになるわけです。

というわけで、ターゲットのアポ体の構造がわかっていたり、新規なスキャフォールドが欲しかったり(知財の関係で)する場合にターゲットのポケットの中で水素結合をする可能性のある残基や主査に水素結合ポイントを定義して三点ファーマコフォアでスクリーニングするというようなこともよくやっていましたが、これは結構ヒット率低かったです。

そもそも、ファーマコフォアポイントじゃないところにファーマコフォアを仮定する時点で外れ確定なのでそのあたりが難しい要因でした。

  • リガンド重ね合わせのアプローチの場合、似た構造を重ね合わせに使ってしまい、アーティファクトが出やすい(ベンゼン環起因のアロマティックなポイントとか)、そもそも異なるポケットに結合しているとか別の残基と相互作用している化合物が混じっているとかで共通項が取れない場合もある。
  • 結晶構造から推定する場合は、水素結合はいいとして、アロマティックなフィーチャーは設定しにくい。Catalystが不安定なコンフォマーもファーマコアマッピングするので、それヒットにしていいの?と疑問を呈したい場合も多々あった。

なので、もし複合体結晶構造がある場合は一度FMOをかけて、きちんと相互作用を確認してからファーマコフォアぽいイントを設定するなり、ドッキングシミュレーションをしたほうが成功確率が上がります。

こんな感じのFMO計算用のAMIがあるとクラスターもってなくてもサクッと計算できるから良いかもしれませんね。てか、今度作ろっと。