フロンティア分子軌道論(FMO)とフラグメント分子軌道法(FMO)

11月に発表したときに、本書をお薦めされたので買って読んでました(訳者に知り合いがちょいちょい入っている)。

役に立ったのは6章の密度汎関数法と16章の定性的理論です。この2つの賞を読むだけでも20K円の価値はあると思いました。

分子の量子力学的視点は負電荷を持つ電子雲によって囲まれた正電荷を持つ原子核という視点に基づいているが、化学における分子は、いまだに 「結合」によってまとまった「原子」群として定式化されている。

古典力学の枠組みでは説明できない現象を説明するモデルとして量子力学が発展したのに、AI的視点で分子をグラフとして扱いGNNで伝播させるとうまくいくのでは的なアプローチに立つのはどうなんでしょうねぇと思っているので、私的には量子化学的な視点からDL/MLを利用したほうが筋が良いんじゃないかなぁと感じています。まぁきちんと証明しろよってことなのですが、、、

ProductName 計算化学(第3版)
森北出版 / ¥19,800 (2023-03-24)

  • 電子数に対するエネルギーの2階微分はハードネス
  • 局所的な求電子性は、ωと対応するFukui関数を掛けることによって得られる。これらの概念は、HSAB原理における重要な役割を担っている
  • hard-hard相互作用は主に電荷支配で、soft-soft相互作用は軌道支配

FMOで考えてみると

Fragment Molecular Orbitalを活用してSBDDをやっていると、リガンドとタンパク質の結合乖離過程は始状態と終状態の変わらない化学反応と捉えることができることが直感的に理解できるかと思います(実際反応する場合はCovalent inhibitorと呼ばれる特殊な状態かと思います)。

となると、「リガンドとタンパク質の化学反応はHSAB原理においてはなんなのだろう?」という疑問が湧いてきます。FMOではタンパク質をアミノ酸というフラグメントに分解できるから、「各アミノ酸の側鎖はhard-hard相互作用, soft-soft相互作用のどちらを担うのだろうか?」とか、そうなるとHSABルールって大域的ではなくて局所的な概念なのかなぁ?と悩み始めます。

そもそもPIEDAがKitaura-Morokuma AnalysisのFMOへの拡張だからなんかそうなんだろうなぁとは思うんだけど、今度偉い人たちにあったら聞いてみようと思いました。

最近参加した学会など

Mishima.syk #20, 第51回構造活性相関シンポジウム, 8th Autumn School of Chemoinformatics in Naraに参加しました。

Mishima.syk #20

  • LLM, ChatGPTの話が面白かった。
  • tweetできる内容を選んでいるつもりだったが、「それ黒に近いグレーじゃないの」という総ツッコミを食らったのでちょっと悔改めた。懇親会は大変楽しかった。

第51回構造活性相関シンポジウム

  • H先生に久しぶりに会えて色々と情報交換できた。
  • 凪でラーメンを食べるだけであった
  • 渋谷は3,4年ぶりだった

8th Autumn School of Chemoinformatics in Nara

  • よりワークショップに近い感じになっていてよかった
  • 奈良の夜は早く、朝もは早いということを実感した。ホテルの清掃準備早すぎ
  • @iwatobipenに倣って朝走ってみた(続ける)
  • 懇親会の日本酒と二次会の日本酒を堪能した。美味しい料理は重要
  • 色々と重要な情報をゲットできたので満足

Visualizing Fukui Function with RDKit

The Utility of the HSAB Principle via the Fukui Function in Biological Systems was interesting stuff, so I tried to visualize the Fukui function.

from fffp import *
from rdkit.Chem import AllChem, Draw
from IPython.display import Image, display
from rdkit.Chem.Draw import SimilarityMaps
Rivaroxaban = "C1COCC(=O)N1C2=CC=C(C=C2)N3CC(OC3=O)CNC(=O)C4=CC=C(S4)Cl"
m = rdkit_optimize(Rivaroxaban)
fp = f_plus(m, basis_sets="6-31G")
fg_fp = SimilarityMaps.GetSimilarityMapFromWeights(m, fp, colorMap='RdBu')
fm = f_minus(m, basis_sets="6-31G")
fg_fm = SimilarityMaps.GetSimilarityMapFromWeights(m, fm, colorMap='RdBu')

fffp is a library that handles Fukui functions in GAMESS, but it is not yet publicly available.

The area around the S1 pocket of Rivaroxaban(Fig. 1) is more susceptible to nucleophilic reactions/binding, while the area around the S4 pocket with the morpholine group(Fig. 2) seems to be more compatible with electrophilic reactions.

Fplus Fig. 1 : F+(r) of Rivaroxaban

Fminus Fig. 2: F-(r) of Rivaroxaban

「合成化学者のメディシナルケミスト像と計算化学者のメディシナルケミスト像は微妙に異なる」という話

趣旨としては「メディシナルケミストは尊い」となります。

詳細省きますが、最近違いを理解していない人が多すぎてげんなりすることが起こったのと、今週末のCBI講演会でこのあたりの話題が話されるので宣伝がてら書いてみます。

下の図は10年くらい前の某BIソフトウェアのユーザー会で発表したときの資料を少し改変したもので、私がメディシナルケミストをどう定義しているかというものです。

WhatMedicinalChemist

創薬プロジェクトで合成化学者の果たす役割はいわゆる創薬プロジェクトのPDCAサイクル(DMTA)において

  • What's to make (何を合成するか)
  • How to make (どうやって合成するか)

の2つに大別されるかと思います。典型的な合成化学者とか合成CROは与えられた化合物をどうやって合成するのかを考えることに100%コミットします。一方で計算化学者/Chemoinformatist/SBDDerは分析結果から次に何を作るべきかに全振りします。

メディシナルケミストはWhat's to make:How to makeの割合が7:3-6:4くらいではないかと思われますが、海外最大手のPは10:0に全振りしていると聞いたことがありますというか、前職の上司がそれが「なんか違うわー」ってことで辞めたと聞きました。

10年前の私は上のスライドに書いてあるように「何を作るべきかを考えられるのがメディシナルケミスト」というポジションだったので、将来的には分析できるChemoinformatist/SBDDerが合成CROをうまく使いこなせば十分にメディシナルケミストとなりうるだろうと考えていました。実際REINVENTが出たりDeepLearningによる逆合成が急速に発展したしね。

ただ、実際ケミストをマネージメントする立場になってみると合成化学知らないとかなり困るなぁと(一応合成化学専攻出てるけどw)能力不足を感じたり、やっぱり機械学習は所詮機械学習で、既存の反応の組み合わせしか辿れないというか未知の反応を提案することができないというか、それはAIが将棋で「銅」っていう新しい駒を作り出せないのと一緒なのかなぁと最近は考えを改めています。

というわけで、きちんと合成化学のバックグラウンドを持った人がWhat's to makeのための技術を獲得するというのが真なるメディシナルケミストなのかなぁと思うようになりました。

とはいえ、What's to makeに全振りしてDruglikenessだけきっちり押さえればSynthetic Feasibilityは別に無視して誰かに任せてもいいというような道もあるよなぁとは思います。

Fukui Functionについて理解を深めた

昨日S先生とディスカッションしていて、Fukui関数ってそういうことなのねと理解を深めました。

ちょっとやりたかったことがあったのだけど、軌道の係数いじったりするコード書くのめんどくさいなーとか思って後回しにしていたので単にmulliken population analysisの結果いじればいいだけだと理解してさっさと実装するかという気分になりました。

FMO計算を通して色々と得たノウハウとか知識をやっとインフォマティクスのほうに応用できるなぁ。これで予測精度上がるかどうかちょっと楽しみ。

Mishima.syk #19やりました。次回の#20は10周年です。

まずは参加者の皆様、発表者の皆様お疲れさまでした。3年ぶりくらいのオフライン開催で久しぶりにみなさんと楽しくやれてよかったです。

たくさん情報交換できたのですが、タンパク質の一時配列もBERTやることに意味がありそうということが知れてよかったです。ただSMILESにBERTはあまり筋が良くないのではとも改めて感じました。

online開催のときにはdiscordを使っていたので、情報が閉じちゃっていましたが、今回はまたTwitterのハッシュタグで追えるようになっています。

日曜日(今日ね)はちょっとやらなきゃいけない仕事があったので終電には帰ろうとちょっと早く抜けたのだけど、週末は終電一本早いのを知らず。タクシーも来ない駅で途方に暮れた結果、結局1時間弱歩いて帰宅することになりましたとさ。

さて、次回のMishima.sykは10月に開催する予定です。そして10年目を迎えることになります。みなさんもとっておきのネタを持参して参加してもらえると嬉しいです。

MIshima.syk #19開催します(2023.2.18)

久々にオフライン開催です。1月中旬から下旬で調整していましたが、会場が押さえられずにこのタイミングになりました。

というわけで、時間は十分にあるので、皆さんのとっておきのネタを持ち寄って楽しくやりましょう。今回オフラインなのでディープな話題もOKです。そしてこれを機に沼津に遊びに来るのもアリです。

Discovery and Structural Characterization of Small Molecule Binders of the Human CTLH E3 Ligase Subunit GID4

Discovery and Structural Characterization of Small Molecule Binders of the Human CTLH E3 Ligase Subunit GID4

GID4に強く結合する化合物を探索するためにフラグメントスクリーニングしたりDELを使ったりするというストーリー

そもそもGID4は結晶構造が取られている上に基質認識のために深いポケットが有ることがわかっているというかFDVSWFMGというデグロンというペプチドを認識することがわかっているので、フラグメントスクリーニングの確度がちょっとあがっているから良い戦略だなと思いました。

ただフラグメントスクリーニングで得られた化合物の結合能はサブuMとそれほど高くなかった。

それとは別にDELを使ったスクリーニングをしているのだが、非天然アミノ酸trimerって感じの戦略なのでうまくペプチドミミックを選んでいるなぁと思いました。まぁそれはみなさんがDELをイメージしているかは別としてGID4の認識能をうまく利用したスクリーニング戦略だなぁと思いました。

さて、E3リガーゼはミスフォールディングを認識すると言われますが、ミスフォールディングって何かなぁと考えると「正しくないフォールディング」ってなるわけで、それって何?っていうのがSBDDとか構造生物関連の人には定義ちゃんとしろよーとか思われると思うのです。

私の解釈だと、「本来蛋白質の3次元構造のパッキングに寄与する疎水性残基が蛋白表面に露出してしまっている」とか「ペプチドの主鎖がうっかりみえてしまっている」とかそういうのがミスフォールディングとして認識されるのかなぁと思っているのでDELで非天然のアミノ酸様トリマーを合成するのはわかるんだけどそれはペプチドなぞってないか?とズルいというか言葉遊びをしているのではないかという気はちょっとします。

それだったらペプチドスクリーニングから論理的に設計して低分子の転換を目指すのが王道っていうか正しいサイエンスなんじゃないかなーと思ってます。ペプチドの相互作用から低分子化目指してスボレキサントまでたどり着くようなイメージですが、、、

テキストから化合物構造生成

面白そうだなと思ったので、早速読んでみました。

Stable Diffusionみたいなノリで使われることになるのかなぁと思いつつも、それだったらメディシナルケミストのサポートくらいにしか使えんよなぁと思ったり。

空気の読めるREINVENTみたいな感じで使えるとちょっと嬉しいけど、あったら嬉しいけどなくても困らん程度のものになりそう。

このあたりまとめている人がいたらちょっと情報交換したいですね。

The Beginning of FMO Era

Evotecから出たこの論文なかなか面白かったですね。"なかなか"というのは我々随分前にこのあたりは通過済みですので。自分たちは取り扱わない蛋白質の事例が多かったので、私にとっては新しく面白い相互作用をいくつも知ることができて満足です。

本論文ではPPIでやっていましたが、ペプチド(環状ペプチド)でも同じことができます。というより我々はそっちを精力的にやっていました。ペプチドは蛋白質と低分子の二重性を示すので面白いモダリティだなぁと思います(課題も多いですがw)このようなFMOの計算結果を用いて、Protein engineeringでより結合の高い蛋白質の設計をしたり、ペプチドの場合より結合能の高いペプチド設計をしたり、それをミミックするような別の分子サイズに置き換えていくのがスタンダードになっていくのだと思います(解釈もしやすいですしね)。

で、こういう仕事を当たり前にやっている状況になると、こんな感じの論文に対し、FMOで論理的に低分子にできるのか(むしろなんでやってないの)?みたいなreplyが脊髄反射でされるようになるわけです。

(鍵垢なので、IDは伏せます)

I wonder if the (inter/intra) FMO interaction patterns with the protein is similar with the peptide and the small ligand

あとはさっさと計算走らせて(大体のpdbファイルは数分でFMO計算走らせられる環境になってる)、暇なときに解析して知識を積み上げるだけのルーチンワークですし、私としてはこういう論文を見つけては、自分で計算したり、チームメンバーのトレーニングとして計算と解釈してもらったりしてますけどなかなか楽しいのでおすすめです。

FMO計算の先について

Evotecの論文だとFig. 4.のLIMK1とCofilin1におけるM115とY514の相互作用とか4kcal/molくらいあるし、Fig.6. のKRAS/SOS1のN879のやたら強い相互作用(hotspot)などは明確に見えてきて面白いのだが、IFIEだと相互作用の強さが定量的に出てくるだけだし、PIEDAは成分に分解するだけでDIが効いているのかESが効いているのかどういう成分が関与しているのかがわかるだけでありこのあたりが(いまのところの)FMOの限界ですよねぇと。

この情報をDrug Designに還元するためにはもう少し理解度をあげないといけなくて、どういう軌道の相互作用により強い相互作用が形成されているのかを理解した上で、化合物のこの場所にこういう置換基を導入して軌道の形を変えてやるべきというような論理性が求められてくるのだと思います。

レトロスペクティブな考察を加えるならこの論文も置換基効果で説明できるタイプのものじゃないかなぁと思います。今度計算してみてきれいな結果が出るようだったらブログネタにするかどっかにポスターでも出しに行こうかなぁと思っています。

実際ノンクラシカルな相互作用がFMOで確認されたら、関与しているフラグメントのHOMO/LUMOチェックしてフロンティア軌道論で説明できるかどうか評価するところまでは基本路線だからね。メドケムの人もリード化合物のHOMO/LUMOくらいは基本として抑えておくと最適化の質が上がるとおもんですけどあんまりやる人いませんよね。 そんなこんなでそういうのPythonでサクッとやりたいよねーといいながらpen先生と一緒に作ったのがpsikitだったりします。

今後のSBDDで重宝されるのは量子化学をきちんと理解してSBDDに活かせる人材かNMR等の実験系をきちんと理解した上でそういう情報とMDを組み合わせてプロジェクトに貢献できる人なんじゃないかなぁと思っています。

FMOについて

FMOは北浦先生により生み出された日本初の手法ですので、Evotecみたいな論文発表が日本からなされると嬉しいですね。FMODDというコンソーシアムもあるので頑張って欲しいです。

うちもなんか貢献を見せないといけませんなぁと思っていますので、近いうちになんか出すと思います。

あとは自分の関与している学会で「ディープすぎるFMO創薬の話」でも企画すればいいんですかねぇ(興味あります?)