24122024 chemoinformatics
創薬 Advent Calendar 2024の24日目の記事です。久しぶりに書いてます。
以前にアドベントカレンダーに投稿してその勢いで入門書を書きました。 おかげさまで200超えの★と90超えのforkを得られたのでまずまず貢献したのかな?と思います。
その後、CBIのケモインフォマティクスハンズオンを開催することになり、そのマテリアルもオープンにしているので興味があれば一度動かしてみてください。
ケモインフォマティクスチュートリアル 2023
一般的なヴァーチャルスクリーニング(VS)を行うための入門的なハンズオン
化合物データの前処理(脱塩等)を行い、訓練データから活性予測モデルを作成。その後VS用のライブラリを構築し、Q活性予測モデルを利用しリガンドベースのヴァーチャルスクリーニング(LBVS)を行うという内容です。
ケモインフォマティクスチュートリアル 2024
こちらは中級以上向けで、完走率は3割切るくらいだったようですが、DRYの製薬企業研究者の2,3年目が到達するレベル感だと思います(私見)。こちらは化合物の生成モデルを使っているので色々応用が効く内容になっているはずです。ワークフローはコードで書いてもKNIME/PipelienPilotにまかせてもどっちでもいいような気がしますがバージョン管理するなら前者ですかね
- REINVENT4の転移学習を使ってEGFR阻害剤を生成するような生成モデルを作成
- 生成モデルに仮想化合物群を生成させ、Gypsum-DLでSBVSの前処理をおこなう
- AutoDock VinaでEGFRのキナーゼドメインに対しSBVSを実行し、結果をpymolで確認する
- (前処理とSBVSはmaizeというflow based programmingツールを使ってワークフロー化します)
ケモインフォマティクスチュートリアル 2025
来年やるとしたらALとかHITL関連のものをやってみたいですね。この論文にあるようにエキスパートを投入して環境に手をいれるっていうAZのアイデアも面白いですし、
Human-in-the-loop active learning for goal-oriented molecule generation https://t.co/tSxLzcF1dI #chemoinformatics #feedly
— kzfm (@fmkz___) December 23, 2024
または、Exscientiaのように生成モデルに工夫をしてRNN+RLじゃなくてビルディングブロックと反応をうまく学習させてより現実的な構造発生させるのにAL使うっていう感じの内容もよいかなと思ってます。
それではよいクリスマスを