生成モデルを使って何するの？

28 12 2020 chemoinformatics Tweet

生成モデルを使って何するの？

生成モデルを使ってより良い化合物提案を効率的に行うアプローチが今年もいくつも提案されています（新しいかどうかは別にして）。

最近だと、2017年に提案されたREINVENTのスコア関数を工夫し、ここにファーマコアを使うというものが出ています。

つい先日のCBI講演会での発表元の論文ですね。Design and Synthesis of DDR1 Inhibitors with a Desired Pharmacophore Using Deep Generative Models https://t.co/iQXr5gSk5O #medchem #feedly
— kzfm (@fmkz___) December 20, 2020

REINVENTは強化学習で方策をかえるやつだから、スコア関数だけ工夫をすれば色々出来て楽しいけど、実際のプロジェクトで成果を出そうと思うとセンスを問われますね。それから、せっかくファーマコフォアを使っているのだから多様なスキャフォールドを提案してきてほしいけど、REINVENTだとなかなか難しそうに感じるのだけどそのあたりどうなんでしょう？単に化合物ライブラリをファーマコフォアでヴァーチャルスクリーニングかけるほうが良い結果を得られるような気がします。

自分がこの手法に期待するとすれば、 市販化合物に存在せず、かつ合成可能であり、ファーマコフォアを満たす新規な化合物の提案 ということになるのかなと。

もう一つちょっと前にpublishされたのがVAEを使ったもので、ドッキングシミュレーションのスコア関数をたよりに潜在空間を探索するもの(多分、アブストしか読んでない)

Maybe the pose estimation and score functions are too rough to converge?　RT @JCIM_ACS: #OptiMol: Optimization of Binding Affinities in Chemical Space for #Drug Discovery https://t.co/PchycEnvsu #ASAP pic.twitter.com/bTEHO7V5bm
— kzfm (@fmkz___) December 27, 2020

ちなみにREINVENTのスコアにドッキングスコアを放り込む方法が既に提案されています。

ただ、ドッキングスコア自体がかなり荒い評価関数なのと、ドッキングポーズの推定がそもそもあまり精度が高くないのでまずはドッキングシミュレーションの精度を上げるほうが先に成すべきことなんではなかろうかと思ってしまいます。

個人的にはLead Optimizationのような骨格を決めてその周辺を探っていくようなフェーズではREINVENT使ってプロジェクトにあわせてスコア関数を工夫すればいいと思っているけど、それよりも前のフェーズで構造に多様性を求めたいフェーズでは潜在空間探索させるのがよいかなーと思っているのでVAE+SELFIESの組み合わせはかなり興味があります。こっちも工夫のしがいが沢山ありますしね。

Drkcore

生成モデルを使って何するの？