12 12 2018 chemoinformatics Tweet
創薬 Advent Calendar 2018の11日目の記事です。
もし「AI創薬のためのケモインフォマティクス入門」ってのがあったら目次はこんなになるんやないやろか?ってものを @iwatobipenと一緒に考えてみた。
対象読者は
- 医学薬学系の大学院生及び薬学系のデータ解析を行いたいポスドク
- 製薬企業の薬理研究者で自分のデータを自分で解析したい人
- または創薬化学者でケモインフォマティクスの必要性を感じている方
- 既に企業でケモインフォマティクスに従事しているがプログラミングスキルに乏しい方
- AI創薬に興味があるがなにからはじめたらいいかわからない人
あたりを想定してみたのだけどもし、「こういう章追加したほうがええんやないか?」とか「これは不要だろ」っていうのがあれば教えてもらえると嬉しいです。RTしてからコメント入れると見逃すのでそこは是非コメント付きRTでよろしくお願いします。
ケモインフォの入門書もあれば絶対に売れると思うのですが。
— ノブ@化学者/研究者の生き方を考える (@chemordie) 2018年12月9日
出版業界の皆さま、絶対に売れる本を作るチャンスですよ。 https://t.co/IesQJ1Jms1
目次
ちょっと追加した(2018.12.12)。web interfaceは入門の範囲を超えそうなのでどうするかは考える。
イントロダクション
- ケモインフォマティクスとは?
ケモインフォマティクスのための環境を整えよう
- Anaconda(Python, Jupyter, scikit-learn)
- RDKit
Pythonプログラミングの基礎
- Pythonの基礎(必要だったら)
- Jupyter notebookで便利に使おう
ケモインフォマティクスのための公開データベース
- ChEMBL
- PubChem
RDKitで構造情報を取り扱う
- SMILESとは?
- 構造を描画してみよう
- 複数の化合物を一度に取り扱うには?
化合物の類似性を評価してみる
- 記述子、フィンガープリント
- 類似度を計算する
沢山の化合物を一度にみたい
- Chemical Spaceとは
- tSNEをつかったマッピング
- 主要な骨格による分類(MCS)
- Matched Molecular Pairによる化合物ネットワーク
構造活性相関(QSAR)の基礎
- 効果ありなしの原因を考えてみる(分類問題)
- 薬の効き目を予測しよう(回帰問題)
- R分解とFree wilson analysis
- モデルの適用範囲(applicability domain)
ディープラーニング入門
- TensorFlowとKerasについて
- Google colab(ずっとフリーかわからないので要検討)
- インストールしてみよう
ディープラーニングを利用した構造活性相関
- 記述子を工夫してみる(neural fingerprint)
- DNNを利用した予測モデル構築
コンピューターに化学構造を考えさせる
- Recurrent Neural Networkを利用した構造生成
我々も、「ケモインフォマティクスとかマテリアルズインフォマティクスやりたいんだけど、何から勉強すればいいんですかね?」みたいな質問されることが多いけど、「この本読んどけばいいよ」って言えなくて辛いので、なんか欲しいなとは思っているのですけどねー。