18 05 2006 chemoinformatics perlmol Tweet
みんな、似たようなこと考えるのね。
Cheminfostream: In silico Library Enumeration of Synthetically Feasible Libraries
“The core functionality to enumerate focused de novo type libraries in Oracle for a number of organic transformations is already available”
一応、Feasibleだったとしてもだ、、、
- Sparseすぎ
- ActiveCompoundあったとしても、活性相関探るために近傍のcompsつくるために手動かさなきゃならんので意外にrapidじゃない。H2Lの部分は速くならないってこと。
- 造り過ぎ
- 楽しいので、ついつい作りすぎてしまうネ。100,000 x 100,000で100億でしょ。さらに多段階合成なんかでもう一回かますともう大変。作るほうはドンドコドンドコ量産されるのでとっても嬉しいんだけど。
でも、大変なのはこっからだ。
どうやって絞込みすんの?
精度のいい予測つかって精度99.0%のモデルでも1億化合物残るね。Rule of X(5,3)だとかいっても、そもそも考慮されていたりするから、意外に減らせなかったり。そうすっと結構泣く。
調子にのって作りすぎなきゃよかった
みたいな。みんな若気の至り汁が出て困ったことがあるはず。