The Beginning of FMO Era

Evotecから出たこの論文なかなか面白かったですね。"なかなか"というのは我々随分前にこのあたりは通過済みですので。自分たちは取り扱わない蛋白質の事例が多かったので、私にとっては新しく面白い相互作用をいくつも知ることができて満足です。

本論文ではPPIでやっていましたが、ペプチド(環状ペプチド)でも同じことができます。というより我々はそっちを精力的にやっていました。ペプチドは蛋白質と低分子の二重性を示すので面白いモダリティだなぁと思います(課題も多いですがw)このようなFMOの計算結果を用いて、Protein engineeringでより結合の高い蛋白質の設計をしたり、ペプチドの場合より結合能の高いペプチド設計をしたり、それをミミックするような別の分子サイズに置き換えていくのがスタンダードになっていくのだと思います(解釈もしやすいですしね)。

で、こういう仕事を当たり前にやっている状況になると、こんな感じの論文に対し、FMOで論理的に低分子にできるのか(むしろなんでやってないの)?みたいなreplyが脊髄反射でされるようになるわけです。

(鍵垢なので、IDは伏せます)

I wonder if the (inter/intra) FMO interaction patterns with the protein is similar with the peptide and the small ligand

あとはさっさと計算走らせて(大体のpdbファイルは数分でFMO計算走らせられる環境になってる)、暇なときに解析して知識を積み上げるだけのルーチンワークですし、私としてはこういう論文を見つけては、自分で計算したり、チームメンバーのトレーニングとして計算と解釈してもらったりしてますけどなかなか楽しいのでおすすめです。

FMO計算の先について

Evotecの論文だとFig. 4.のLIMK1とCofilin1におけるM115とY514の相互作用とか4kcal/molくらいあるし、Fig.6. のKRAS/SOS1のN879のやたら強い相互作用(hotspot)などは明確に見えてきて面白いのだが、IFIEだと相互作用の強さが定量的に出てくるだけだし、PIEDAは成分に分解するだけでDIが効いているのかESが効いているのかどういう成分が関与しているのかがわかるだけでありこのあたりが(いまのところの)FMOの限界ですよねぇと。

この情報をDrug Designに還元するためにはもう少し理解度をあげないといけなくて、どういう軌道の相互作用により強い相互作用が形成されているのかを理解した上で、化合物のこの場所にこういう置換基を導入して軌道の形を変えてやるべきというような論理性が求められてくるのだと思います。

レトロスペクティブな考察を加えるならこの論文も置換基効果で説明できるタイプのものじゃないかなぁと思います。今度計算してみてきれいな結果が出るようだったらブログネタにするかどっかにポスターでも出しに行こうかなぁと思っています。

実際ノンクラシカルな相互作用がFMOで確認されたら、関与しているフラグメントのHOMO/LUMOチェックしてフロンティア軌道論で説明できるかどうか評価するところまでは基本路線だからね。メドケムの人もリード化合物のHOMO/LUMOくらいは基本として抑えておくと最適化の質が上がるとおもんですけどあんまりやる人いませんよね。 そんなこんなでそういうのPythonでサクッとやりたいよねーといいながらpen先生と一緒に作ったのがpsikitだったりします。

今後のSBDDで重宝されるのは量子化学をきちんと理解してSBDDに活かせる人材かNMR等の実験系をきちんと理解した上でそういう情報とMDを組み合わせてプロジェクトに貢献できる人なんじゃないかなぁと思っています。

FMOについて

FMOは北浦先生により生み出された日本初の手法ですので、Evotecみたいな論文発表が日本からなされると嬉しいですね。FMODDというコンソーシアムもあるので頑張って欲しいです。

うちもなんか貢献を見せないといけませんなぁと思っていますので、近いうちになんか出すと思います。

あとは自分の関与している学会で「ディープすぎるFMO創薬の話」でも企画すればいいんですかねぇ(興味あります?)

ASP–ARG塩橋とヘテロ環の相互作用に関する論文が多くの示唆を含んでいる件

PsikitでEnergy Decomposition Analysis(EDA)をやりたくてKitaura-Morokuma Analysisとか実装されてないかなーと調べてたんですが、SAPTってのを使えばよろしいらしいところまでは到達した。

でもって、そのあたり使ってる論文がJ.C.I.Mあたりに投稿されてないかなーとさらに調べた結果、Tuning Stacking Interactions between Asp–Arg Salt Bridges and Heterocyclic Drug Fragmentsという論文をみつけて読んだらやばかったという話。

Asp–Arg塩橋とヘテロ環のスタッキングってよくみられるし強い相互作用っぽいんだけど、よくわかってないよね?だから量子化学計算で調べるわっていう内容で、単環、二環、三環のヘテロ環(窒素シャッフリングが多い)の63モデルでローカルミニマム、グローバルミニマムを探索して、どういう位置関係になっているかとかEDAしてみてどういう成分が効いているのかを調べていた。

得られた結論としては塩橋だけどヘテロ環はカチオニックな残基(LYS,ARG)との相互作用のほうが安定に形成しそうだってことと、ElectroStaticな項が相互作用に支配的で、DispersionInteractionがまぁまぁ効いてそうってこと。それから双極子モーメントはほとんど寄与していないってことから無指向性の相互作用ってこと。

論文では塩橋をモデル化しているけど、内容をよく考えるてみるとこれはおそらくカチオニックな残基単体でも成り立つだろうし、そっちのほうが強いんだろうなぁというところまで理解できたので非常に良かった。うまくやればプロアクティブにヘテロ環導入して活性向上できるかなと思う。一方でなんでカチオニックな残基との相互作用が強いの?ってことに関してはおそらく窒素シャッフリングの環だからだろうなぁと思った。

じゃぁアニオニックな残基(ASP,GLU)と強く相互作用するようなヘテロ環、アリルは何よ?っていう疑問が湧くと思うんだけど、そっちに関しては既に理解しているのでそのあたりまとめてどこかで発表しようかなと思っている。ちょっとコントラバーシャルかなーと思わないこともないけど、量子化学系の人たちがもっとSBDDに参入するきっかけになってくれると嬉しいなーと。

BXA(ゾフルーザ)低感受性の遺伝子変異I38TをFMOで評価した

面白そうなお題が与えられたのでやってみた。ちなみにすぐにFMO計算できる環境なので面白そうな複合体の情報があれば教えてください、計算して可能な範囲で公開します。

計算方法

  • FMO-MP2/6-31G
  • リガンドは奥と手前のNC単結合で二分割
  • Mgは取り払って配位は考慮してない(そっち側のフラグメントは無視)
  • PDB-Code:6FS6/6FS7の比較だと余計なノイズが交じるので6FS6をI38TにしたものでPIEDAの差分をとった

結果

6FS6のPIEDA。グラフの見方は縦軸がエネルギーで安定な相互作用だと負にでます。EXは反発項なので常に制に出ます。横軸は残基で本来はN末から順番に並んでいますが、みやすさのために相互作用が5kcal/mol以上の相互作用のみ表示するようにしています。

見て分かる通りLYS034, ILE038との相互作用が強い。ILEとのDIがかなり強いことがわかる。8kcalあるし相当強いですね。 尚、EXちょっと強めに出てるのはエナジー最適化ちょっとまずってるのか、立体的に込み入った分子だから力場が良くなかったのかも。

PIEDA

で、これをI38Tにして差分を取ると38番目の残基のDIが2.5kcal/molくらい不安定になってEXが1kcal/molくらい安定化しました。それ以外の大きな差はみられなかった。今回EXに関しては大目に見るとして、経験的にはDI項結構効いてるんじゃないですかね?koff測定すればもっとはっきりしたこと言えるかなぁと思いました。

6FS6 IFIE

上のIFIEを実際にリガンド結合サイトで塗ったものです。青いところが安定な相互作用しているところで赤いと反発してます。

IFIE

6FS6 DI

DIだけの成分で塗り直したものです。ILEとこんなに強いDIで安定化してる例見たことないから結構感動した。粘着感がありますねw

DI

おまけ

DIで安定化していてSARと突き合わせて見られる例としてはFXaのS4ポケットがあります。FXaは複合体結晶構造もSARの論文もたくさん出ているので興味があれば調べてみるとよいと思います。

ピューっと吹くAI創薬

創薬 Advent Calendar 2018の9日目の記事です.

タイトルは適当ですが、内容はまともです。

タンパク質とリガンドの相互作用をきちんと理解する

Fragment Molecular Orbital Method(FMO)という方法があります。詳細はリンクか本を買って読んでもらえればと思いますが、要するにタンパク質とリガンドの相互作用を高精度に計算する手法です。

さて、このFMOをつかってA Medicinal Chemist’s Guide to Molecular Interactionsの再解釈をやるとどういうことがわかるかというと、読書感想文? としか言えないものが意外と(予想通り?)多いということですね。特に目視の解釈難しいそうだよなーってものは想像だけで解釈した純度100%のロマン結合ばっかりだった。結局きちんとFMO計算してPIEDAから相互作用を解釈するのがドラッグデザインには重要ということですね。もう一つ重要なことはリガンドの結合乖離過程というのは構造変化を伴わない、つまり生成物と反応物が変わらない化学反応(触媒反応)であるということですね E + L -> [EL] -> E + L 化学反応であるということはフロンティア軌道論で考える必要もあるのではないかということにつながり、LUMOもまた重要なファクターである可能性が高いという結論が導かれます。

ここまで簡単にまとめると

  • タンパク質とリガンドとの相互作用を解釈するには量子化学計算が必要
  • 相互作用を化学反応の一種として解釈するならLUMOも重要そう

ケモインフォマティクスによる活性予測

さて、ケモインフォマティクスでは上であげた相互作用をリガンドのみの情報から予測することになりますが、リガンドの性質を表す特徴ベクトルとして色々なフィンガープリントが提唱されています。

しかしながら、これらの手法はそもそも原子間の化学結合や相互作用については教えてくれないため予測精度の向上に関しては限界があることがわかりきっています、もしくは既に限界付近まできてる可能性も低くはないのではないかと考えています。

つまり何らかの形で分子軌道を取り込まないと、ケモインフォマティクスはスクリーニングレベルの大雑把な方法としてしか使えなくて創薬のリード最適化には役に立たないざっくりとした手法にとどまるんじゃないでしょうかね?

フロンティア軌道の情報を取り込むようなイケてる方法論があればいいなーと思いますが、なかなか難しいですね。

結論

  • 活性予測の精度向上には、リガンドの記述方法に量子力学に基づいたアプローチが必要なのでは?

おまけ

こういうディープな議論がしたければMishima.sykにGO。次回は2/9にやります

今日読んだ論文

今日は飛行機の中でいくつか論文読んだのでメモを残しておこうと思ったんだけど、全部座席の網棚に置いてきてしまったらしい。邪魔だったから読み終わったのをパンフの網棚に突っ込んで最後に取り出すのを忘れたw 個人的には最後のJ.C.T.C.のやつが面白かったです、FMOにも触れられているのでSBDDerは目を通すべき。

Drug Repurposing Using Deep Embeddings of Gene Expression Profiles

ざっと目を通したんだけど embedding spaceってのが実態としてどんなもんなのかピンとこなかった。実装見て手を動かさないとわかんないのかなぁ。次元圧縮してどうすんだろ?

もう少し先行論文たどってみようかと思う。

Exploring Activity Profiles of PAINS and Their Structural Context in Target–Ligand Complexes

キャッチーな絵を見てPAINSをSBDD的に解釈するのかなーと思い読んでみたんだけど、なんかよくわからない話だった。最近あまりライブラリとかHTSに興味が無いのも相まって読み飛ばしてしまった。構造出したらちゃんと解釈してもらわないとね。

A Simple Representation Of Three-Dimensional Molecular Structure

E3FPの論文も ACSのほうを再度読み返してみた。部分構造に3次元情報を取り入れて細分類してECFPからどれくらいの精度が上がるかっていうのは興味ありますよね。このあたりはPLECにも拡張する余地ありそうだけど、それでどこまで上積みが見込めるかというところでしょうかね。

Theoretical Study of Protein–Ligand Interactions Using the Molecules-in-Molecules Fragmentation-Based Method

創薬わかってる感じやなーと思いつつ読んでいて読み終わってから共著にLilyの人が入ってるの気づいた。元論文紛失しちゃったから引用できないんだけど、FMOはFragmentationのやり方のせいで高精度の基底関数とかDiffuse関数を使いにくい(使っても精度が出にくい)、だから6-31G+分極関数くらいの基底関数の論文が多いみたいなことが書いてあったのと、精度出すには結論パートでダイナミクスを考慮しないといけないみたいなことが書いてあって、 ダイナミクス考慮するなら基底関数の精度そんなに要らないんじゃ? とちょっと思った。あと相互作用エネルギーにsolvation energy考慮していてあれってどの程度効いてくるのかなーとふと思いました。

って書いてたらあと1報読んだの思い出した。

Anion-π Interactions in Computer-Aided Drug Design: Modeling the Inhibition of Malate Synthase by Phenyl-Diketo Acids

これはRivaroxabanとかと同じような相互作用ですかね?FMOかけると楽しい案件だと思った。ただPDKAってAcidだから負電荷持ってるしMgイオンとも相互作用してるっぽいので計算する時にちょっと手間ですね、、、

A Combination of QSAR Molecular Docking (or X-Ray Structure ) and Molecular Dynamics

最近MDと従来のQSARテクニックを組み合わせた手法が提案されていますね。

アプローチとしては静的な状態である三次元構造に動的な情報を付与させるために10ns-20ns程度の短いMDをかけてからサンプリングして、従来の3D-QSARの記述子を計算してMEAN,MEDIAN,SDを取るという方法です。

5th Autumn School of Chemoinformatics in Nara, 2017ではThierry Langer先生がDynamic Pharmacophores: A New Way to Enhance Virtual Screening Screening Efficacy in Early Drug Discoveryということで、ファーマコフォアモデリングでアンサンブルをとっていた。

11th ICCSではShuzhe Wangの発表したMolecular Dynamics Fingerprints (MDFP): Combining MD and Machine Learning to Predict Physicochemical Propertiesというポスターは独自記述子を定義していて興味深かったし、Fourches, DenisのNext-Generation MD-QSAR Models of Dynamic Kinase-Inhibitor Interactions Based on Machine Learning and Molecular Dynamicsは3D-WHIMの拡張で大変すごかった。特にMDを使うことでactivity cliffの解釈ができていたという点に非常に感銘を覚えた。activity cliffは単純にリガンドからの類似性っていう人間主観のアプローチがもたらすミスマッチだからそれをきちんと説明できるのは本当にすごいと思います(立体障害じゃないやつを)。

このようなアプローチではMDを計算してサンプリングしたあとに、どういう計算で静的な状態を記述するかというのが重要なのだと思いますが、勘のいいあなたはもう既におわかりのように、既にFMOを組み合わせた手法が提案されています。この手法はかなりプロミッシングではないかなーと感じています。なぜかわからないヒトは「すごいよFMO!」を10回くらい読み直しましょう。

そもそも、QM/MMやらんでMDでサンプリングして力場よりずっと精度のいいFMO計算なんかして順番が逆なんじゃないの?とか思っていたが、実際やってみると精度出そうだし不思議だなーと思っていたのだけど、さっきシャワーを浴びていたらなんとなく理解して嬉しくなったのでちょっとエントリーをこしらえてみました。

それぞれの演題には既にペーパーでているのが多いので興味があったら追いかけるといいと思います。