また面白そうな本が出たなぁと思いながら、手を出すべきか辞めるべきかと目次を見ていたら13章におもしろい節を発見した。
- 13.1 タンパク質構造の中のパターンを見つける
構文解析器生成系ANTLRの開発者であり、サンフランシスコ大学教授のTerence Parrが贈る、言語実装パターンの解説書。構文解析、意味解析、インタプリタ構築を通じて、言語アプリケーション開発に必要な知識が身につきます。
考えてみるに、生物系ってコンパイラとソースコードがセットになったような変な処理系だよなぁと。
情報系よりの学会に行くと、RNAの立体構造を抽象的な文字列表現だけから予測しようとしして、物理化学的な性質無視してるから精度が出ないんじゃないのとか思う一方、大まかには記号化された抽象表現だけで大体合うから不思議だよなぁと。
タンパク質もそうだしねー。
一方で、(特に低分子の)創薬研究ってのは文字列の並びというよりは、フォントの書体の美しさとか、単語の並びの意味とかそういうあたりに着目するので、プログラム言語的にはLLのソースコード読みながらアセンブラの動きをイメージするような技術が求められるのかなーと。