BXA(ゾフルーザ)低感受性の遺伝子変異I38TをFMOで評価した

面白そうなお題が与えられたのでやってみた。ちなみにすぐにFMO計算できる環境なので面白そうな複合体の情報があれば教えてください、計算して可能な範囲で公開します。

計算方法

  • FMO-MP2/6-31G
  • リガンドは奥と手前のNC単結合で二分割
  • Mgは取り払って配位は考慮してない(そっち側のフラグメントは無視)
  • PDB-Code:6FS6/6FS7の比較だと余計なノイズが交じるので6FS6をI38TにしたものでPIEDAの差分をとった

結果

6FS6のPIEDA。グラフの見方は縦軸がエネルギーで安定な相互作用だと負にでます。EXは反発項なので常に制に出ます。横軸は残基で本来はN末から順番に並んでいますが、みやすさのために相互作用が5kcal/mol以上の相互作用のみ表示するようにしています。

見て分かる通りLYS034, ILE038との相互作用が強い。ILEとのDIがかなり強いことがわかる。8kcalあるし相当強いですね。 尚、EXちょっと強めに出てるのはエナジー最適化ちょっとまずってるのか、立体的に込み入った分子だから力場が良くなかったのかも。

PIEDA

で、これをI38Tにして差分を取ると38番目の残基のDIが2.5kcal/molくらい不安定になってEXが1kcal/molくらい安定化しました。それ以外の大きな差はみられなかった。今回EXに関しては大目に見るとして、経験的にはDI項結構効いてるんじゃないですかね?koff測定すればもっとはっきりしたこと言えるかなぁと思いました。

6FS6 IFIE

上のIFIEを実際にリガンド結合サイトで塗ったものです。青いところが安定な相互作用しているところで赤いと反発してます。

IFIE

6FS6 DI

DIだけの成分で塗り直したものです。ILEとこんなに強いDIで安定化してる例見たことないから結構感動した。粘着感がありますねw

DI

おまけ

DIで安定化していてSARと突き合わせて見られる例としてはFXaのS4ポケットがあります。FXaは複合体結晶構造もSARの論文もたくさん出ているので興味があれば調べてみるとよいと思います。

ピューっと吹くAI創薬

創薬 Advent Calendar 2018の9日目の記事です.

タイトルは適当ですが、内容はまともです。

タンパク質とリガンドの相互作用をきちんと理解する

Fragment Molecular Orbital Method(FMO)という方法があります。詳細はリンクか本を買って読んでもらえればと思いますが、要するにタンパク質とリガンドの相互作用を高精度に計算する手法です。

さて、このFMOをつかってA Medicinal Chemist’s Guide to Molecular Interactionsの再解釈をやるとどういうことがわかるかというと、読書感想文? としか言えないものが意外と(予想通り?)多いということですね。特に目視の解釈難しいそうだよなーってものは想像だけで解釈した純度100%のロマン結合ばっかりだった。結局きちんとFMO計算してPIEDAから相互作用を解釈するのがドラッグデザインには重要ということですね。もう一つ重要なことはリガンドの結合乖離過程というのは構造変化を伴わない、つまり生成物と反応物が変わらない化学反応(触媒反応)であるということですね E + L -> [EL] -> E + L 化学反応であるということはフロンティア軌道論で考える必要もあるのではないかということにつながり、LUMOもまた重要なファクターである可能性が高いという結論が導かれます。

ここまで簡単にまとめると

  • タンパク質とリガンドとの相互作用を解釈するには量子化学計算が必要
  • 相互作用を化学反応の一種として解釈するならLUMOも重要そう

ケモインフォマティクスによる活性予測

さて、ケモインフォマティクスでは上であげた相互作用をリガンドのみの情報から予測することになりますが、リガンドの性質を表す特徴ベクトルとして色々なフィンガープリントが提唱されています。

しかしながら、これらの手法はそもそも原子間の化学結合や相互作用については教えてくれないため予測精度の向上に関しては限界があることがわかりきっています、もしくは既に限界付近まできてる可能性も低くはないのではないかと考えています。

つまり何らかの形で分子軌道を取り込まないと、ケモインフォマティクスはスクリーニングレベルの大雑把な方法としてしか使えなくて創薬のリード最適化には役に立たないざっくりとした手法にとどまるんじゃないでしょうかね?

フロンティア軌道の情報を取り込むようなイケてる方法論があればいいなーと思いますが、なかなか難しいですね。

結論

  • 活性予測の精度向上には、リガンドの記述方法に量子力学に基づいたアプローチが必要なのでは?

おまけ

こういうディープな議論がしたければMishima.sykにGO。次回は2/9にやります

今日読んだ論文

今日は飛行機の中でいくつか論文読んだのでメモを残しておこうと思ったんだけど、全部座席の網棚に置いてきてしまったらしい。邪魔だったから読み終わったのをパンフの網棚に突っ込んで最後に取り出すのを忘れたw 個人的には最後のJ.C.T.C.のやつが面白かったです、FMOにも触れられているのでSBDDerは目を通すべき。

Drug Repurposing Using Deep Embeddings of Gene Expression Profiles

ざっと目を通したんだけど embedding spaceってのが実態としてどんなもんなのかピンとこなかった。実装見て手を動かさないとわかんないのかなぁ。次元圧縮してどうすんだろ?

もう少し先行論文たどってみようかと思う。

Exploring Activity Profiles of PAINS and Their Structural Context in Target–Ligand Complexes

キャッチーな絵を見てPAINSをSBDD的に解釈するのかなーと思い読んでみたんだけど、なんかよくわからない話だった。最近あまりライブラリとかHTSに興味が無いのも相まって読み飛ばしてしまった。構造出したらちゃんと解釈してもらわないとね。

A Simple Representation Of Three-Dimensional Molecular Structure

E3FPの論文も ACSのほうを再度読み返してみた。部分構造に3次元情報を取り入れて細分類してECFPからどれくらいの精度が上がるかっていうのは興味ありますよね。このあたりはPLECにも拡張する余地ありそうだけど、それでどこまで上積みが見込めるかというところでしょうかね。

Theoretical Study of Protein–Ligand Interactions Using the Molecules-in-Molecules Fragmentation-Based Method

創薬わかってる感じやなーと思いつつ読んでいて読み終わってから共著にLilyの人が入ってるの気づいた。元論文紛失しちゃったから引用できないんだけど、FMOはFragmentationのやり方のせいで高精度の基底関数とかDiffuse関数を使いにくい(使っても精度が出にくい)、だから6-31G+分極関数くらいの基底関数の論文が多いみたいなことが書いてあったのと、精度出すには結論パートでダイナミクスを考慮しないといけないみたいなことが書いてあって、 ダイナミクス考慮するなら基底関数の精度そんなに要らないんじゃ? とちょっと思った。あと相互作用エネルギーにsolvation energy考慮していてあれってどの程度効いてくるのかなーとふと思いました。

って書いてたらあと1報読んだの思い出した。

Anion-π Interactions in Computer-Aided Drug Design: Modeling the Inhibition of Malate Synthase by Phenyl-Diketo Acids

これはRivaroxabanとかと同じような相互作用ですかね?FMOかけると楽しい案件だと思った。ただPDKAってAcidだから負電荷持ってるしMgイオンとも相互作用してるっぽいので計算する時にちょっと手間ですね、、、

A Combination of QSAR Molecular Docking (or X-Ray Structure ) and Molecular Dynamics

最近MDと従来のQSARテクニックを組み合わせた手法が提案されていますね。

アプローチとしては静的な状態である三次元構造に動的な情報を付与させるために10ns-20ns程度の短いMDをかけてからサンプリングして、従来の3D-QSARの記述子を計算してMEAN,MEDIAN,SDを取るという方法です。

5th Autumn School of Chemoinformatics in Nara, 2017ではThierry Langer先生がDynamic Pharmacophores: A New Way to Enhance Virtual Screening Screening Efficacy in Early Drug Discoveryということで、ファーマコフォアモデリングでアンサンブルをとっていた。

11th ICCSではShuzhe Wangの発表したMolecular Dynamics Fingerprints (MDFP): Combining MD and Machine Learning to Predict Physicochemical Propertiesというポスターは独自記述子を定義していて興味深かったし、Fourches, DenisのNext-Generation MD-QSAR Models of Dynamic Kinase-Inhibitor Interactions Based on Machine Learning and Molecular Dynamicsは3D-WHIMの拡張で大変すごかった。特にMDを使うことでactivity cliffの解釈ができていたという点に非常に感銘を覚えた。activity cliffは単純にリガンドからの類似性っていう人間主観のアプローチがもたらすミスマッチだからそれをきちんと説明できるのは本当にすごいと思います(立体障害じゃないやつを)。

このようなアプローチではMDを計算してサンプリングしたあとに、どういう計算で静的な状態を記述するかというのが重要なのだと思いますが、勘のいいあなたはもう既におわかりのように、既にFMOを組み合わせた手法が提案されています。この手法はかなりプロミッシングではないかなーと感じています。なぜかわからないヒトは「すごいよFMO!」を10回くらい読み直しましょう。

そもそも、QM/MMやらんでMDでサンプリングして力場よりずっと精度のいいFMO計算なんかして順番が逆なんじゃないの?とか思っていたが、実際やってみると精度出そうだし不思議だなーと思っていたのだけど、さっきシャワーを浴びていたらなんとなく理解して嬉しくなったのでちょっとエントリーをこしらえてみました。

それぞれの演題には既にペーパーでているのが多いので興味があったら追いかけるといいと思います。