07042019 栃木
5年ぶりくらいに餃子の街に帰省してきました。
子供達に餃子でも食べさせておくかとみんみんに寄った。
子供が喜んでいたのでまぁ良しとしよう。
次の日は池袋のアニメイトに寄って、その後原宿をウロウロして、さらにお台場に移動して科学未来館で遊ぶという強行軍で疲れた。
07042019 栃木
5年ぶりくらいに餃子の街に帰省してきました。
子供達に餃子でも食べさせておくかとみんみんに寄った。
子供が喜んでいたのでまぁ良しとしよう。
次の日は池袋のアニメイトに寄って、その後原宿をウロウロして、さらにお台場に移動して科学未来館で遊ぶという強行軍で疲れた。
30032019 chemoinformatics
うちのSlackオルタネティブのAI創薬絡みのチャンネルではArxivの機械学習新着が流れてくるようになっていて、たまに大きな桃がどんぶらこどんぶらこと流れてきては、中身をぶった切ってチャンネル参加者の皆でキャッキャウフフしてるわけです。
で、今回流れてきたのがStep Change Improvement in ADMET Prediction with PotentialNet Deep FeaturizationというPande先生のとこで開発したPotentialNetっていう手法をメルクのデータで検証したら調子良かった(良すぎ!)っていう論文です。
なんかfuとかmicrosomeのクリアランスとかADMEの予測がすごい改善していて期待度高いです。PotentialNetってのはGCNN(Neural FP)のとこにLeRUじゃなくてGRUつかうことで特徴量抽出を工夫しているようです。具体的になにがよろしくなってどういう特徴量が抽出されているのかイメージつかめないんですが、何が良くなるんでしょうね?
それから実装はPyTorchらしいけどGithubには上がってないようなので自分で再実装する必要ありそうだし、最初にAtomにどういう情報持たせるのかに工夫の余地はありそう。
PotentialNetはいずれdeepchemに取り入れられるのでしょうか?
深層学習も積みっぱなしだから読まないと、、、
27032019 chemoinformatics
参加者の皆様お疲れ様でした。楽しんでいただけて且つ何か得るものがあったのなら企画の甲斐があったなと思います。
それにしてもauto-DMTAやばかったですね。我々も頑張らないといけないなーと思いました。
さて、Thierryさんとはどういう経由で呼んだの?とかなり聞かれたのですが、実は去年のICCSでポスター出してたのでネホリンハホリンしたら次の日のexcursionで話しかけてきたので、「来年AI in Medicinal Chemistry企画してるんだけど興味ある?」って聞いたら「めっちゃある、呼ばれたら絶対行くで!」って、まぁそんな感じで決まりました。ICCSは面白い割に日本からの参加者はほぼいないので機会があれば参加すると良いと思います(3年ごとに開催)。
尚、ランチははん亭にしました。
演者は懇親会は質問攻めにあってあまり食べられないので、皆で帰りに「にし乃」に寄りました。
美味しかった。
23032019 chemoinformatics
ちょっと質問されたので、py4chemoinformaticsの説明追加してみたんだけど自分の中で問題が整理されて良かった。
結局acivity cliffとかmagic methylってのはApplicability domainの問題ではなくて、特徴量の抽出のほうの問題なんですよね。グラフ類似性が実際の三次元の構造の類似性とは微妙に違うし、結合モードの類似性とかとも異なるのに、その類似性が活性の類似性と相関するという仮説そのものが正しくない可能性があるということを認識した上でモデルを作らんといかんよなと再認識させられた。
尚、CoMFAはぶつかって活性消失したという事実がないとモデリングできないし、ファーマコフォアの排除体積も同様。ドッキングのスコア関数はそれっぽい特徴表現だけど、粗すぎてネガティブスクリーニングにしか使えんけど、ファーマコフォア表現ってのが特徴量としては一番しっくりくるかなと言ったところ。
今年も会社のみなさんと一緒に富士錦の蔵開きに行ってきました。
色々お話できて濃厚な時間を過ごしました。
帰りに富士宮をブラブラして、ヨコゼキ寄ったり、さの萬寄ったりできて良かった。
16032019 life
O2研に用があったので帰りに新橋の鶴松でやきとんしてきました。
下田さん家の豚は山田さんが育てているそうです。山田さんの育てた豚はすこぶる美味しかった。
かしらとホルモン
色々食べだけど美味しかった。今度は馬力にも行きたい
13032019 chemoinformatics
ファーマコフォアはもともとは、同じターゲットで複数の異なる骨格の薬剤とか開発化合物を3次元的に重ね合わせて共通の特徴を抽出するLBDD的な手法により推定されていてCatalystを使って計算するのが一般的だったように思います。
で、ファーマコフォアを作ろうとする話で触れられているように、ファーマコフォアをSBDDの側から解釈するとターゲット蛋白質でのポケット内で、強く相互作用している残基とリガンドの官能基の相互作用を見ていることになるわけです。
というわけで、ターゲットのアポ体の構造がわかっていたり、新規なスキャフォールドが欲しかったり(知財の関係で)する場合にターゲットのポケットの中で水素結合をする可能性のある残基や主査に水素結合ポイントを定義して三点ファーマコフォアでスクリーニングするというようなこともよくやっていましたが、これは結構ヒット率低かったです。
そもそも、ファーマコフォアポイントじゃないところにファーマコフォアを仮定する時点で外れ確定なのでそのあたりが難しい要因でした。
なので、もし複合体結晶構造がある場合は一度FMOをかけて、きちんと相互作用を確認してからファーマコフォアぽいイントを設定するなり、ドッキングシミュレーションをしたほうが成功確率が上がります。
こんな感じのFMO計算用のAMIがあるとクラスターもってなくてもサクッと計算できるから良いかもしれませんね。てか、今度作ろっと。
13032019 work
図書館に本を返しに行ったら、新刊コーナーに置かれていたので借りてみた。5章の「いい本の作り方」が読みたかったんだけどね。
かなり参考になった。
10032019 work
なんか1週間くらい前にこれについて書かなきゃ!という強い動機があったんだけど、今では全く覚えていないw
まぁ、でも「ほう!」って思う人もいるかもしれないのでちょっと書いておく。
よくワークライフバランスをシーソーに例えて対立するものとして図示するものが多いんだけど、お手玉とかジャグリングもバランスを取る動作の一つだと思います。つまり、仕事に取り組んでいる間は余暇を宙ぶらりんにしてるわけだし、余暇を満喫しているときには仕事から離れていると。
つまり、両者はリズムを取りながら自分の人生そのものを構築しているわけです。たまに仕事が重くなることはあるけどそれは余暇を圧迫して人生を台無しにするものではないし、より重いタスクのほうがジャグリングのやりがいがあるんじゃないかね。
ワークライフシナジーは隠れた名著だと思うので、軽く読んでおくといいと思います。
中古で1円だしコスパ良いよ
別件で調べ物をしていたら10年くらい前に検討したエントリを見つけたので、これをpsi4のSAPTでやったらどういう結果になるかな?と。
今回psi4コマンドで流すのでinputはこんな感じです(いずれはpsikitでサクッと計算できるようにしたい)。EmacsやめちゃったからVimでgamessのインプットいじってつくった。繰り返しの技を覚えたけど、こういうの手になじまないとめんどくさいですね。
molecule cation_pi { 1 1 N 26.56861 22.88472 72.47206 C 25.05591 23.05763 72.38527 C 27.18276 23.04159 71.08205 C 27.14794 23.94295 73.40648 C 26.89124 21.49601 73.01604 H 24.65761 22.29324 71.71973 H 24.84300 24.05067 71.99229 H 26.95089 24.04166 70.71972 H 26.73892 22.29197 70.42917 H 28.26387 22.89551 71.15590 H 26.89847 24.92550 73.00913 H 28.22884 23.81270 73.44995 H 26.70726 23.81001 74.39332 H 26.46855 20.75492 72.33939 H 26.44825 21.40230 74.00640 H 27.97398 21.38820 73.06968 H 24.63622 22.94695 73.38408 -- 0 1 C 30.61324 20.49644 72.40614 C 30.47183 21.03406 71.19420 C 30.79531 21.59051 73.36029 C 30.75216 22.77934 72.62888 C 31.00908 21.63948 74.74382 N 30.43745 22.45766 71.27884 C 30.92671 24.02761 73.23103 C 31.18435 22.86580 75.34238 C 31.14962 24.05129 74.58925 H 30.33993 20.55500 70.23268 H 31.04481 20.72825 75.32842 H 30.86231 23.00634 70.52231 H 30.90815 24.93911 72.64846 H 31.36065 22.92555 76.40870 H 31.30378 24.99933 75.08996 H 30.61446 19.44515 72.64676 units angstrom no_reorient symmetry c1 } set basis 6-31g_d_p_ energy('sapt0')
10年も経つと6-31G**でもサクッと終わるのね。subaracy!
結果はこのあたりを見ればいいんですかね。ESも効いてるけどInduction(CT+mixみたいな項?)とDispersionも効いてるから、次はカチオンの有無でトリプトファンのそれぞれの原子のRESP chargeがどのくらい変化するかとか双極子どうなっているかとか確認すればいいんかな。
Special recipe for scaled SAPT0 (see Manual): Electrostatics sSAPT0 -13.53632077 [kcal/mol] Exchange sSAPT0 10.77916633 [kcal/mol] Induction sSAPT0 -5.12922298 [kcal/mol] Dispersion sSAPT0 -5.69289464 [kcal/mol] Total sSAPT0 -13.57927206 [kcal/mol] -------------------------------------------------------