Scanning the torsional potential in Psikit(RDKit+Psi4)

Considering the conformational effects of the compound is important in Structure Based Drug Design, this paper discussed about it, in terms Protein-Ligand binding using torsional scan of each ligands(PDB:2JH0,2JH5,2JH6). They calculated torsional energy, and explained the relation between inhibitory activity and torsional energy.

Torsional scanning is the task of the quantum chemistry rather than that of chemoinformatics. But I wanted to conduct quantum chemical calculation as an extention of chemoinformatics way, so I implemented it in Psikit

日本語訳

jupyterでRDKitからのB3LYP/6-31G*でのDFT計算さっくりうごくの素晴らしい。

BXA(ゾフルーザ)低感受性の遺伝子変異I38TをFMOで評価した

面白そうなお題が与えられたのでやってみた。ちなみにすぐにFMO計算できる環境なので面白そうな複合体の情報があれば教えてください、計算して可能な範囲で公開します。

計算方法

  • FMO-MP2/6-31G
  • リガンドは奥と手前のNC単結合で二分割
  • Mgは取り払って配位は考慮してない(そっち側のフラグメントは無視)
  • PDB-Code:6FS6/6FS7の比較だと余計なノイズが交じるので6FS6をI38TにしたものでPIEDAの差分をとった

結果

6FS6のPIEDA。グラフの見方は縦軸がエネルギーで安定な相互作用だと負にでます。EXは反発項なので常に制に出ます。横軸は残基で本来はN末から順番に並んでいますが、みやすさのために相互作用が5kcal/mol以上の相互作用のみ表示するようにしています。

見て分かる通りLYS034, ILE038との相互作用が強い。ILEとのDIがかなり強いことがわかる。8kcalあるし相当強いですね。 尚、EXちょっと強めに出てるのはエナジー最適化ちょっとまずってるのか、立体的に込み入った分子だから力場が良くなかったのかも。

PIEDA

で、これをI38Tにして差分を取ると38番目の残基のDIが2.5kcal/molくらい不安定になってEXが1kcal/molくらい安定化しました。それ以外の大きな差はみられなかった。今回EXに関しては大目に見るとして、経験的にはDI項結構効いてるんじゃないですかね?koff測定すればもっとはっきりしたこと言えるかなぁと思いました。

6FS6 IFIE

上のIFIEを実際にリガンド結合サイトで塗ったものです。青いところが安定な相互作用しているところで赤いと反発してます。

IFIE

6FS6 DI

DIだけの成分で塗り直したものです。ILEとこんなに強いDIで安定化してる例見たことないから結構感動した。粘着感がありますねw

DI

おまけ

DIで安定化していてSARと突き合わせて見られる例としてはFXaのS4ポケットがあります。FXaは複合体結晶構造もSARの論文もたくさん出ているので興味があれば調べてみるとよいと思います。

生命科学データ解析

先週のMishima.sykの懇親会では著者による「サイン付き著者割生命科学データ解析を支える情報技術」が人気を博しておりましたが、うっかり速攻アマゾンで予約するという失態を犯した私のもとにも無事に届きました。

ProductName 生命科学データ解析を支える情報技術
坊農 秀雅
技術評論社 / ?円 ( 2019-02-09 )


私は今月からバイオインフォマティクスの部署も担当することになったので、もし 「企業で俺のバイオインフォマティクス力の高まりを顕現させてみようかな?」 という方がおられる、または周りにおられる、もしくは共同研究してみてもいいんじゃない?みたいな研究室があればお知らせいただければ、美味しいクラフトビールなど飲みながら詳細詰めさせていただければと思っていますので右のアイコンからコンタクトよろしくおねがいします。興味のある仕事は勉強がてら今後エントリにあげようと思っています。

今回、これ最高だったので資料が上がって嬉しい。

追いかけないといけないことが増えた。

Mishima.syk #13やりました

今回バイオインフォマティクス寄りの発表がいくつかあったので、非常に勉強になった。テンソル分解ちゃんと勉強しないとなと思いました。

ハンズオンのほうは、condaはあまり万能じゃないなと。油断してた。Windowsだとunzipのcondaバイナリないとか、SMILESを""で囲うとだめだとかよくわからないエラーに悩まされた。まぁでもWindowsでもREINVENTが動いたので良かったとしよう。

お昼は王味で小エビラーメン

1549758352

懇親会の刺し身

1549758350

二次会のリパブリューのラムチョップ

1549758354

そしてアルコール度数17.5%のビール

1549758357

次回もまた楽しくやりましょう

来週末はMishima.sykです

参加はこちらから。

今回の会の趣旨とか狙いみたいなものはこちらを御覧ください

私はSitagliptinのアナログを出すようなジェネレータを動かすハンズオンをやろうかなと考えています。デモのために訓練300回させたモデルでとりあえずjupyter notebook作ってみましたが、出来がイマイチなので週末にでも3000 iterationくらい回したモデルを作り直して更新する予定です。

May your soul rest in peace

One of the founders of Mishima.syk passed away.

We can fly But We want his wings We can shine even in the darkness But We crave the light that he brings Revel in the songs that he sings My angel XXX

Mishima.syk #13でGenerator mini hands-onをやります

あけましておめでとうございます、今年もよろしくおねがいします。

昨日まで日本酒飲みまくってグダグダしていたので、今日からそろそろ始動しようかなと思います。@iwatobipenがアクティブにGitHubにプッシュしまくっているみたいなので、Mishima.sykのタイムスケジュールも更新しましたが、あと40分くらい空いているのでLT入れたい人は早めに時間を確保してください。

今回はGenerator mini hands-onをやることにしました。理由は、第404回CBI学会講演会ではThierry KogejさんにMolecular de novo design through deep learningと似たような公演をしてもらう予定にしているからです。

スライド3でDe novo molecular generation with deep learning has developed very rapidlyってあるんだけど、今大体どのくらいの化合物生成してくるのかを知らないと、公演楽しめないと思うんですよね。この手の話って知らないで聞くと期待感あふれるストーリーなのか、現実味を帯びているのかいまいち掴めないという。

というわけで彼らの提案しているREINVENTを実際に動かして、化合物提案がどんなもんなのかを見てみようというハンズオンになります。予めChEMBLでトレーニング済みのモデルはこちらで用意しましたのでjupyterでちょっとコード打てば動くようにする予定です。

本当は参加者に、それぞれ上市された薬剤のもとの特許を渡して、生成モデルがどのくらい生成したら実施例をカバーすんのかな?っていうのをやってもらうハンズオンにしたかったんだけど、それはGPU必須っぽいので今回は断念しました。

参加はこちらから。

ハンズオンをやってから改めて読むと味わい深いエントリはこちらです。

Self-assessment of this year

今年を振り返ると書いたエントリ数は100弱だった。昔は1エントリ/day以上は書いていたので最近はブログに対する意欲は薄れているが、後から振り返るためにもう少し書くようにしたい。

仕事関連

今の会社に入って2年ちょいだけど、今年は成果が沢山でてよかったと思う。チームで社外発表を全部で10以上できたし、来年講演に呼ばれているの確定なの4,5はあるしね。来年も社外発表を通して議論、フィードバックをもらいながら成長していきたい。

または overwhelming growth ってやつ?w

一方で去年の振り返りに埋め込んだTEDの動画にあるように、去年はタイミングが良かったというのもあると思うんですよね。「半歩先の仕事の発表だったからウケた」みたいな。サービスとしてはありなんだろうけど、サイエンスとしてはどうなのかなーと思わなくもない。マジョリティが理解できる程度にしか先に進んでないってことだから、すぐに追いつかれる強みにしかならんのかなーとも思うので、そのあたりも考えていかねばいけませんね。と、そういうことを考えられるようになったのも進捗した結果なのでそれはそれで嬉しいことですが。

来年は 「単純なAI based XX」っていうネタも落ち着いて、ドメイン知識が必要ななにか新しいことをプラスしないと評価されなくなってくるっていうようになるんじゃないかなぁーって思います。特にケミストリーはAIっていう焼畑農業である程度焼き尽くしちゃった感があるしね。そのあたり、少し進めていければいいなと思っています。

あと来年はちょっとBioinformaticsのお手伝いもしないといけないのでそっちもきちんと成果を出せるようにしたいけど。まずは環境を整えないといけないなって感じですね。あとバイオインフォの情報も追いかけないといけないので大変になりそう。

ProductName ビジョナリー・カンパニー2 飛躍の法則
ジム コリンズ
日経BP社 / ?円 ( 2014-08-29 )


あと英語力をもっとあげていきたい。僕もエントリ英語にしようかな。

仕事以外のこと

手術というものを初めて経験した、盲腸だけど。それからPokemon GoのトレーナーレベルがMax(40)に到達したら、あまり運動をしなくなってしまった。良くないのでなにかしないとなーと思っている。

Augmented Medicinal Chemistry

将棋を指される方はご存知だと思いますが、将棋ウォーズっていうアプリがあって、それには棋神というコンピューターが3手くらい指してくれるシステムが存在します。

ま、どういうことかと言うと、自分の能力を超えてブーストしてくれるわけですね(実際あれを使うと万能感に浸れますw)。

で、化学構造の生成モデルも似たような立ち位置として使えるんじゃないかなーと話していて、最近、実際にそういう事例の話を聞かされて、やっぱブーストするのか!と感激したわけです。

なにもないところからアイデアを出すのは人間には苦痛を伴う作業だけど、幾つかの選択肢が与えられた場合、妙手を選びやすいのは人間の特性なのかなーと思った次第。

螺旋階段を登り続ける

私のブログのタイトルは好きなドラムンベースのさらに細かいジャンルからとっているわけですが、最近聴いてる新譜が妙に昔懐かしのJungle感を感じさせる曲が混じってるなと思い、

ProductName Waystone
Whiney
Imports / ?円 ( 2018-12-06 )


とtweetしたらありがたいreplyを頂き、よく考えたら確かに分子設計もぐるぐる回っておなじ歴史を繰り返しているようでいて、実は色々と前進しているんだよなーと、一つ思い出したので書いておきます。FMOのことですがw

私とFMOの出会いはかなり古くて、1999だか2000だったか覚えていませんが、CBIの年会に北浦先生がポスター出されていたのを目ざとく見つけて、あれこれというかネホリンハホリンした挙げ句、激ヤバマスト!!!と大興奮したのを忘れていません。

ま、もちろんその当時の同僚や上司のレスポンスは冷笑そのものであったことは言うまでもないことでしたけど、実際のところそもそも計算資源がなかったし、まぁそんなもんかなって感じでしたね。どうしても蛋白-リガンド複合体の計算したかったら切り出してモデル化するのがその当時の王道だったしね(そして製薬企業でやってるのはほとんど見なかったけど)。

その後、数年くらいで基盤の整備が行われてCBI主体の講習会などが開かれて、FMOは誰でも使えるようになったんですが、それでもコンピューター資源の制約は大きくて、このあたりで$40000くらい投資して導入したクラスター(AMDのCPUだったと思う)で計算しても6-31Gくらいの基底関数だと1weekくらいかかっていた(はず)

で、まぁ今だと、ちょっとした投資でクラスター組めば同じくらいの計算5,6時間で終わるし、AWS使えばもっともっと早く計算できるっていう状況になってるっていうのがよくよく考えてみると感慨深いわけです。

というわけで、計算機資源の速度向上や、結晶化の技術がFMOでやれることの可能性を広げているので、なにか新しい貢献ができるといいなーと思いました。