帰省してきた

5年ぶりくらいに餃子の街に帰省してきました。

1554634816 1554634820

子供達に餃子でも食べさせておくかとみんみんに寄った。

1554634813 1554634818

1554634822

子供が喜んでいたのでまぁ良しとしよう。

次の日は池袋のアニメイトに寄って、その後原宿をウロウロして、さらにお台場に移動して科学未来館で遊ぶという強行軍で疲れた。

ADMET Prediction with PotentialNet

うちのSlackオルタネティブのAI創薬絡みのチャンネルではArxivの機械学習新着が流れてくるようになっていて、たまに大きな桃がどんぶらこどんぶらこと流れてきては、中身をぶった切ってチャンネル参加者の皆でキャッキャウフフしてるわけです。

で、今回流れてきたのがStep Change Improvement in ADMET Prediction with PotentialNet Deep FeaturizationというPande先生のとこで開発したPotentialNetっていう手法をメルクのデータで検証したら調子良かった(良すぎ!)っていう論文です。

なんかfuとかmicrosomeのクリアランスとかADMEの予測がすごい改善していて期待度高いです。PotentialNetってのはGCNN(Neural FP)のとこにLeRUじゃなくてGRUつかうことで特徴量抽出を工夫しているようです。具体的になにがよろしくなってどういう特徴量が抽出されているのかイメージつかめないんですが、何が良くなるんでしょうね?

それから実装はPyTorchらしいけどGithubには上がってないようなので自分で再実装する必要ありそうだし、最初にAtomにどういう情報持たせるのかに工夫の余地はありそう。

PotentialNetはいずれdeepchemに取り入れられるのでしょうか?

深層学習も積みっぱなしだから読まないと、、、

ProductName 深層学習 (アスキードワンゴ)

ドワンゴ / ?円 ( 2018-08-27 )


AI in Medicinal Chemistry終わりました

参加者の皆様お疲れ様でした。楽しんでいただけて且つ何か得るものがあったのなら企画の甲斐があったなと思います。

それにしてもauto-DMTAやばかったですね。我々も頑張らないといけないなーと思いました。

さて、Thierryさんとはどういう経由で呼んだの?とかなり聞かれたのですが、実は去年のICCSでポスター出してたのでネホリンハホリンしたら次の日のexcursionで話しかけてきたので、「来年AI in Medicinal Chemistry企画してるんだけど興味ある?」って聞いたら「めっちゃある、呼ばれたら絶対行くで!」って、まぁそんな感じで決まりました。ICCSは面白い割に日本からの参加者はほぼいないので機会があれば参加すると良いと思います(3年ごとに開催)。

尚、ランチははん亭にしました。

1553687389

演者は懇親会は質問攻めにあってあまり食べられないので、皆で帰りに「にし乃」に寄りました。

1553687384 1553687387

美味しかった。

ADと特徴量

ちょっと質問されたので、py4chemoinformaticsの説明追加してみたんだけど自分の中で問題が整理されて良かった。

結局acivity cliffとかmagic methylってのはApplicability domainの問題ではなくて、特徴量の抽出のほうの問題なんですよね。グラフ類似性が実際の三次元の構造の類似性とは微妙に違うし、結合モードの類似性とかとも異なるのに、その類似性が活性の類似性と相関するという仮説そのものが正しくない可能性があるということを認識した上でモデルを作らんといかんよなと再認識させられた。

尚、CoMFAはぶつかって活性消失したという事実がないとモデリングできないし、ファーマコフォアの排除体積も同様。ドッキングのスコア関数はそれっぽい特徴表現だけど、粗すぎてネガティブスクリーニングにしか使えんけど、ファーマコフォア表現ってのが特徴量としては一番しっくりくるかなと言ったところ。

富士錦の蔵開き

今年も会社のみなさんと一緒に富士錦の蔵開きに行ってきました。

1552905738 1552905741

色々お話できて濃厚な時間を過ごしました。

1552905734 1552905736

帰りに富士宮をブラブラして、ヨコゼキ寄ったり、さの萬寄ったりできて良かった。

鶴松でやきとん

O2研に用があったので帰りに新橋の鶴松でやきとんしてきました。

1552742057

下田さん家の豚は山田さんが育てているそうです。山田さんの育てた豚はすこぶる美味しかった。

1552742054 1552742059

かしらとホルモン

1552742062 1552742064

色々食べだけど美味しかった。今度は馬力にも行きたい

ファーマコフォアについてのよもやま話

ファーマコフォアはもともとは、同じターゲットで複数の異なる骨格の薬剤とか開発化合物を3次元的に重ね合わせて共通の特徴を抽出するLBDD的な手法により推定されていてCatalystを使って計算するのが一般的だったように思います。

で、ファーマコフォアを作ろうとする話で触れられているように、ファーマコフォアをSBDDの側から解釈するとターゲット蛋白質でのポケット内で、強く相互作用している残基とリガンドの官能基の相互作用を見ていることになるわけです。

というわけで、ターゲットのアポ体の構造がわかっていたり、新規なスキャフォールドが欲しかったり(知財の関係で)する場合にターゲットのポケットの中で水素結合をする可能性のある残基や主査に水素結合ポイントを定義して三点ファーマコフォアでスクリーニングするというようなこともよくやっていましたが、これは結構ヒット率低かったです。

そもそも、ファーマコフォアポイントじゃないところにファーマコフォアを仮定する時点で外れ確定なのでそのあたりが難しい要因でした。

  • リガンド重ね合わせのアプローチの場合、似た構造を重ね合わせに使ってしまい、アーティファクトが出やすい(ベンゼン環起因のアロマティックなポイントとか)、そもそも異なるポケットに結合しているとか別の残基と相互作用している化合物が混じっているとかで共通項が取れない場合もある。
  • 結晶構造から推定する場合は、水素結合はいいとして、アロマティックなフィーチャーは設定しにくい。Catalystが不安定なコンフォマーもファーマコアマッピングするので、それヒットにしていいの?と疑問を呈したい場合も多々あった。

なので、もし複合体結晶構造がある場合は一度FMOをかけて、きちんと相互作用を確認してからファーマコフォアぽいイントを設定するなり、ドッキングシミュレーションをしたほうが成功確率が上がります。

こんな感じのFMO計算用のAMIがあるとクラスターもってなくてもサクッと計算できるから良いかもしれませんね。てか、今度作ろっと。

「かんたん出版マニュアル」を読んだ

図書館に本を返しに行ったら、新刊コーナーに置かれていたので借りてみた。5章の「いい本の作り方」が読みたかったんだけどね。

ProductName かんたん出版マニュアル
杉浦浩司 牧村康正(スーパーバイザー)
星雲社 / 1512円 ( 2018-11-07 )


  • 文章の統一に気をつけましょう
  • 本は書き手が楽しむものではなく読み手が楽しむものです
  • 本の構成案を入念に計画する
  • 「の」「が」「は」を多用しないようにする

かなり参考になった。

ワークライフバランスの「バランスを取る」ということ

なんか1週間くらい前にこれについて書かなきゃ!という強い動機があったんだけど、今では全く覚えていないw

まぁ、でも「ほう!」って思う人もいるかもしれないのでちょっと書いておく。

よくワークライフバランスをシーソーに例えて対立するものとして図示するものが多いんだけど、お手玉とかジャグリングもバランスを取る動作の一つだと思います。つまり、仕事に取り組んでいる間は余暇を宙ぶらりんにしてるわけだし、余暇を満喫しているときには仕事から離れていると。

つまり、両者はリズムを取りながら自分の人生そのものを構築しているわけです。たまに仕事が重くなることはあるけどそれは余暇を圧迫して人生を台無しにするものではないし、より重いタスクのほうがジャグリングのやりがいがあるんじゃないかね。

ワークライフシナジーは隠れた名著だと思うので、軽く読んでおくといいと思います。

中古で1円だしコスパ良いよ

Cation-π相互作用をSAPT0してみた。

別件で調べ物をしていたら10年くらい前に検討したエントリを見つけたので、これをpsi4のSAPTでやったらどういう結果になるかな?と。

今回psi4コマンドで流すのでinputはこんな感じです(いずれはpsikitでサクッと計算できるようにしたい)。EmacsやめちゃったからVimでgamessのインプットいじってつくった。繰り返しの技を覚えたけど、こういうの手になじまないとめんどくさいですね。

molecule cation_pi {
     1 1
     N 26.56861  22.88472  72.47206
     C 25.05591  23.05763  72.38527
     C 27.18276  23.04159  71.08205
     C 27.14794  23.94295  73.40648
     C 26.89124  21.49601  73.01604
     H 24.65761  22.29324  71.71973
     H 24.84300  24.05067  71.99229
     H 26.95089  24.04166  70.71972
     H 26.73892  22.29197  70.42917
     H 28.26387  22.89551  71.15590
     H 26.89847  24.92550  73.00913
     H 28.22884  23.81270  73.44995
     H 26.70726  23.81001  74.39332
     H 26.46855  20.75492  72.33939
     H 26.44825  21.40230  74.00640
     H 27.97398  21.38820  73.06968
     H 24.63622  22.94695  73.38408
     --
     0 1
     C 30.61324  20.49644  72.40614 
     C 30.47183  21.03406  71.19420 
     C 30.79531  21.59051  73.36029 
     C 30.75216  22.77934  72.62888 
     C 31.00908  21.63948  74.74382 
     N 30.43745  22.45766  71.27884 
     C 30.92671  24.02761  73.23103 
     C 31.18435  22.86580  75.34238 
     C 31.14962  24.05129  74.58925 
     H 30.33993  20.55500  70.23268
     H 31.04481  20.72825  75.32842
     H 30.86231  23.00634  70.52231
     H 30.90815  24.93911  72.64846
     H 31.36065  22.92555  76.40870
     H 31.30378  24.99933  75.08996
     H 30.61446  19.44515  72.64676

     units angstrom
     no_reorient
     symmetry c1
}

set basis 6-31g_d_p_

energy('sapt0')

10年も経つと6-31G**でもサクッと終わるのね。subaracy!

結果はこのあたりを見ればいいんですかね。ESも効いてるけどInduction(CT+mixみたいな項?)とDispersionも効いてるから、次はカチオンの有無でトリプトファンのそれぞれの原子のRESP chargeがどのくらい変化するかとか双極子どうなっているかとか確認すればいいんかな。

Special recipe for scaled SAPT0 (see Manual):
  Electrostatics sSAPT0         -13.53632077 [kcal/mol]     
  Exchange sSAPT0                10.77916633 [kcal/mol]      
  Induction sSAPT0               -5.12922298 [kcal/mol]     
  Dispersion sSAPT0              -5.69289464 [kcal/mol]     
Total sSAPT0                    -13.57927206 [kcal/mol]     
-------------------------------------------------------