Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization (Part 5)

Part 5はいままでのパートにはいらないけど、ケミストが知っておくべき事柄的な章の集まりかな。

ProductName Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization
Edward Kerns,Li Di
Academic Press / ¥ 9,177 ()
在庫あり。

  1. Diagnosing and Improving Pharmacokinetic Performance
  2. Prodrugs
  3. Effects of Properties on Biological Assays
  4. Formulation

これで一通り読んだが、良書だった。

Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization (Part 4)

Part 4はメソッド。予測モデル使う時とかHTSみたいなハイスループットなアッセイ系のQCやるとき、さらにはシステムでの情報管理の際には実験系に対するある程度の理解がないとまるでダメなので、ここら辺は基本的に実験系も含めて結構把握している。

最後のほうの毒性系のアッセイとかは知らないことが多くて参考になった。

ProductName Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization
Edward Kerns,Li Di
Academic Press / ¥ 9,177 ()
在庫あり。

  1. Strategies for Integrating Drug-Like Properties Into Drug Discovery Methods
  2. Methods for Profiling Drug-like Properties: General Concepts
  3. Lipophilicity Methods
  4. pKa Methods
  5. Solubility Methods
  6. Permeability Methods
  7. Transporter Methods
  8. Blood-Brain Barrier Methods
  9. Metabolic Stability Methods
  10. Plasma Stability Methods
  11. Solution Stability Methods
  12. CYP Inhibition Methods
  13. Plasma Protein Binding Methods
  14. hERG Methods
  15. Toxicity Methods
  16. Integrity and Purity Methods

Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization (Part 3)

Part 3はDMPKとtoxicity。QSPR的というよりはもうちょとケミストよりのそういったissueに対してどういう骨格変換のアプローチをするかといった内容。

なので、経験則的なものが若干多め。ケミストリー的には量子化学計算的な手法を用いながら適切な修飾を選ぶといったものももうちょっと入ってきてもいいんじゃないかなぁと思うけど。一方、インフォマティクスとかのコンピュテーショナルケミストは、パラメータとフィルタリングとかそういうのばっかりに行きがちで、リアルな化合物を出すという視点が失われがちだからこういった本は読みやすくてよいと思う。

結局、メディシナルケミストってのはwhat's to makeであってHow to makeじゃないんだよね。とか考えると解析的な側面から入るか、合成可能性の制約から入るかの違いで行き着くところは同じような気はするんだけど。

ProductName Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization
Edward Kerns,Li Di
Academic Press / ¥ 9,177 ()
在庫あり。

  1. Transporters
  2. Blood-Brain Barrier
  3. Metabolic Stability
  4. Plasma Stability
  5. Solution Stability
  6. Plasma Protein Binding
  7. Cytochrome P450 Inhibition
  8. hERG Blocking
  9. Toxicity
  10. Integrity and Purity
  11. Pharmacokinetics
  12. Lead-like Compounds
  13. Strategies for Integrating Drug-Like Properties Into Drug Discovery Methods

さて、このPartに関してはvitroに近いところは理解できるんだけど、生体に近いところはイメージが掴めない。もっと毒性とか解剖学に近いところも勉強しないと、全体を見渡せないかもしれないなぁと思った。

Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization (Part 2)

Part 2は物性の話。ここらへんはQSPRの範疇だから割と読みやすかった。 ほとんどおさらい的な内容だが、Chemistry色が強いので、知っとくとケミストと話がしやすいかもしれない。

ProductName Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization
Edward Kerns,Li Di
Academic Press / ¥ 9,048 ()
在庫あり。

  1. Rules for Rapid Property Profiling From Structure
  2. Lipophilicity
  3. pKa
  4. Solubility
  5. Permeability Disposition, Metabolism and Safety

7の溶解性の部分は他の章よりも厚い。予測モデルとかのstate-of-the-artが載ってなかったりするけど、モデルをうまく合成計画に取り入れるのも今どきは重要なんではないかね。

パターンベースのフィンガープリント

化学構造の類似度を測るフィンガープリントで部分構造由来のものには2種類あって、ビットにパターンが対応しているものと、そうでないもの。

後者はハッシュ関数とかを使って動的に生成するのでビットの密度の効率が良いが、結局解釈できなくて困ることが多い。

で、前者を解釈しましょうっていうスレッドがあったので書いてみた

ProductName ケモインフォマティックス―予測と設計のための化学情報学
J.Gasteiger,T.Engel
丸善 / ¥ 18,900 ()
在庫あり。

openbabelのフィンガープリントを使ってSVMの予測モデルを作る

久々にケモインフォクックブックを更新した。

で、このフィンガープリント使って予測モデルを作ってみる。

Benchmark Data Set for in Silico Prediction of Ames Mutagenicity のSupporting InformationにAmes試験のデータセットがあるのでこれを使ってcsvを用意する。

babel -ismi ci900161g_si_001/smiles_cas_N6512.smi -ofpt ci900161g.fpt -xh -xfFP2

これでfptファイルを用意してクックブックので変換

f2b.py ci900161g.fpt > fingerprint.txt

さらにフィンガープリントをcsvにするのは下のやっつけスクリプトで。

file = "ci900161g_si_001/smiles_cas_N6512.smi"

dic = {"0":"negative","1":"positive"}
act = {}
for l in open(file,"r"):
   smi,id,num = l.split()
   act[id] = dic[num]


fingerprints_file = "fingerprint.txt"

header = "ID,"

for i in range(1,1025):
   header += "bit" + str(i) + ","

header += "act"
print header

for l in open(fingerprints_file, "r"):
   col = ""
   id, fp = l.split()
   col += "\"" +id + "\","
   for c in fp:
       col += c + ","
   col += "\"" + act[id] + "\""
   print col

実行

python fconv.py > ci900161g.csv

でRで解析してみる。

ames <- read.csv("/Users/kzfm/ci900161g.csv")
set.seed(50)
tr.num <- sample(6512,2500)
ames.train <- ames[tr.num,]
ames.test <- ames[-tr.num,]
ames.svm <- ksvm(act ~.,data=ames.train[,-1])
ames.pre <- predict(ames.svm, ames.test[,c(-1,-1026)])
ames.tab <- table(ames.test[,1026],ames.pre)
sum(diag(ames.tab))/sum(ames.tab)

結果

>     sum(diag(ames.tab))/sum(ames.tab)
[1] 0.7771685
> ames.tab
          ames.pre
           negative positive
  negative     1424      425
  positive      469     1694

まぁまあかなぁ。フィンガープリントとかカーネルを考えればもうちょっと精度が上がる気もするが。

参考

ProductName マシンラーニング (Rで学ぶデータサイエンス 6)
辻谷 将明,竹澤 邦夫
共立出版 / ¥ 3,675 ()
通常1~2か月以内に発送

Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization

第一部を読んだ。

ProductName Drug-like Properties: Concepts, Structure Design and Methods: from ADME to Toxicity Optimization
Edward Kerns,Li Di
Academic Press / ¥ 9,048 ()
在庫あり。

これはなかなか名著の予感がしますな。(DMPKやin silicoから見ると)ちょっと浅い気もするが、メディシナルケミスト向けの本だったらこのぐらい押さえておけばいいのかもしれない(というかこの本の内容理解してるケミストって数人しか知らんけど)。

LeadOptimizationから前臨床のあたりのin vivoにおいてどういったパラメータに気をつけながら合成をするか的な内容なので、コンピュテーショナルなヒトだとEkinsなんかを併せて読んだほうがいいかもしれない。

BKChem

ちょっと描きたいときに便利なので、macbookに入れた。

bkchem

BKChem

本が出てた

ドッキングシミュレーション関係の本だろうか。

ProductName タンパク質計算科学 ―基礎と創薬への応用― [CD-ROM付]
神谷 成敏
共立出版 / 5040円 ( 2009-08-25 )


あとGaussian

Gaussianは使ってないのでこっちはあまり興味をそそられないが。

カーネル主成分分析

普通のPCAとちがうのは非線形主成分を扱えること。でも、カーネル関数をうまく選ばないといけないことを意味する。

Rとカーネル法を参考に。

> library(kernlab)
> x <- as.matrix(iris[,1:4])
> iris.kpc1 <- kpca(x,kernel="rbfdot",feature=2,kpar=list(sigma=0.1))
> plot(pcv(iris.kpc1),col=as.integer(iris[,5]))

kpca

あータニモトカーネルを使ったkernel PCAとかなんかいいかもしれない。

ProductName パターン認識と機械学習 下 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社 / ¥ 8,190 ()
在庫あり。