03052020 bioinformatics
筆者らはバイオインフォマティクスを「DNAやアミノ酸の配列情報を主に文字の配列と見てその検索や文法を解析する学問」とするのに対し、ゲノム系計算科学を「ゲノムを物理的実体と見て自然科学的に理解するための学問」としている。
DNAとそれに結合するタンパク質の間の電気的相補性はどうも分子認識の特異性にはあまり関係しないと考えられる。
このあたりですね。
色々と面白いことが書いてあったが、膜貫通蛋白の構造生物学が好きな人向けかな。
03052020 bioinformatics
30042020 bioinformatics
29042020 bioinformatics
27042020 bioinformatics
半年以上前に購入した分子細胞免疫学をやっと読み終えた
補体のあたりから苦行すぎてちょっと投げ出してた。だって、蛋白質のメカニズム(物理化学的な)やつにあてはめると疑問符が付きまくる事象を覚えないといけないなんて、まるで、歴史とか地理の暗記してるみたいだし、、、
で、以下の本を副読本として読んだら、分子細胞免疫学の内容も理解しやすくなった。素晴らしい。
これであと2周くらいは読める。次は、気になった蛋白質をPDBで検索しながら読むことになると思う。
昔、CD14とかTLRの立体構造予測をしていたことがあってLRR(ロイシンリッチリピート)っていうなんかダンゴムシみたいな構造キモいなと思っていたんだけど、今回勉強し直して、あのドメインは自然免疫系としては実に理にかなった構造ではないか!と感動したのであった。
26042020 work
問題を理解していないと悲しいことになるので、そういう事態を避けるために読んでおくと良い本を三冊紹介したいと思う。すべて名著です。
試験計画をたてるならとりあえずやってみるではなくて、何と何の違いを見てどうなることを期待するくらいは持っていて欲しい。結果出したいんか、時間を消費したいのかよくわからんやつ多すぎやぞ、最近。できるだけ無駄な時間を使わないで結果出すのがベストだと思うんやけどね、、、
— kzfm (@fmkz___) April 23, 2020
古典だけど名著。娘が高校生になったら読ませようと決めている本。
私は発売と同時に買ったから10年くらい前に読んだ。レビューは検索かけると色々出てくるのでそっちをあたってほしい。製薬系の研究者でもこのあたり意識できると生産性が全然変わるでしょう。
去年の同じような時期にもおすすめした気がするけどいい本なので。上の2冊が問題解決の手段を与える本なのに対し、こちらは問題そのものを探したり、仮設構築の論理を話題にしている。
サイエンティストとしては道を切り開かなきゃですよね。
An answer is always the stretch of road that's behind you. Only a question can point the way forward.
25042020 chemoinformatics bioinformatics
在宅勤務+GWのコンボで暇なので駄文を書いてみることにしました。だらだらと調べ物をしてたり、文章の推敲をしていたらあっというまに3時間くらい消費してしまったので、もし役に立ったらこのあたりからパンダンリーフとかカラピンチャとか乾燥ポルチーニを送りつけてもらうと嬉しいです。
または代わりにビールでも注文してあげてください(たいてい、週末の帰りにここで一杯飲みながら今日のような内容を考えているのでお店に貢献したい)。
3L弱でこの値段はお得なのでGWの家飲みに注文かけておくと良いかと思います。https://t.co/M7fqIgLdHZ
— kzfm (@fmkz___) April 24, 2020
尚、このエントリはとりあえず製薬企業に入りたいとかいう修士向けの内容ではなくて、ジョブディスクリプション型の応募、つまり、製薬企業の研究開発職にポスドクから転身したいとか、他社へ転職したいとかいう人向けのハックだと思っています。
ざっくり言うとオープン・イノベーションのサイトを眺めて企業の内情を想像しようって話です。
たいていの製薬企業が毎年報告するR&D報告書は押さえましょう。R&Dとして長期的に進みたい方向が示されているので、自分のやりたいことと企業の進む方向性にずれがないかはこのあたり読んでいるとわかります。ただし成果報告については現場のお化粧がマシマシされていたり、トップ層の夢がまぶされていることが多いので、額面通りに受け取るのは危険です。他社でも内情知ってると「うわー、そこ盛っちゃうか!」とか「あれ、その領域辞める方向で進んでるんじゃなかったっけ、とりあえずアピールだけかな?」とかわかるので、前職などのR&D報告はフィクションとして楽しめたりしますw
概ねR&Dトップの意思や目指す方向はその企業の進む方向なのでこれを理解しておくことは重要です。
「製薬企業、オープン・イノベーション」で検索をかけるといくつか解説がヒットするのでまずは目を通しましょう
背景としては大体こんな感じで、外部との連携をスムースに行うためにオープン・イノベーション担当部署が設置されて、外部からの提案を広く受け付けるために公募サイトが設置されることになります。ただし公募サイトはなんでもうけつけるわけではなく、先ほどでたような企業の成長方向に沿ったもの(R&D報告書に記載している)になると思います。
このとき、R&Dの成長戦略に沿ってオープン・イノベーション担当部署が独立して動くようであればベンチャーキャピタル(VC)の様相を呈して、案件の評価もほぼ独立して担当することになるでしょう。つまりこのスライドの11枚目のベンチャー活用型オープン・イノベーションというやつです。この場合は外部の提案に対し、Go/No-goの判断をするだけなのであまり見るべきところはありませんが、単独で評価できる能力があるということは相当優秀な人材を集めたなぁとは思うのでVC的な仕事がしてみたければこういうところに潜り込むことを考えても良いかもしれません。
さて、先のスライドのもう一つのほう、産学連携型オープンイノベーションというのが今回のポイントとなります。
スライドでは
日本では創薬ベンチャーの育成が十分でなく、学の優れた成果を産に活かす産学連携が革新的な医薬品開発の推進に必須であると考える
と書いてありますが、要は産学共同で企業のニーズに合った技術革新を行ってお互いハッピーになりましょうということだと思います。この場合、ニーズは現場から吸い上げられオープン・イノベーション担当部署にてまとめられるので、そのリストは近視眼的で生々しい(具体的な)ものとなりがちです。つまり、現時点で現場が困っていて解決したい案件がニーズとしてあがりがちだということです。
重要な点は、ニーズ提案部署の能力の限界をそこから見積もることができるということです。もし、そのニーズがstate-of-the-art(SOTA)を超えたところにあり、自分のスキルやチャレンジの方向が一致していると、そういうところで働くとハッピーになれる可能性が高いでしょう。あとは募集が出てなくてもコネをたどるとなんとかなることもあるでしょう。(現場からすると協業でも人材獲得でもそんなに大差ないし、欲しいのはそういう技術をもった人材なので)
逆にSOTAに遠く及ばんだろみたいなウィッシュが上がっていたりすると、チームのレベルがそれほど高くない可能性があったり、AIが云々とかの抽象的すぎる大雑把なニーズだったりするとニーズ提案部署にプログラミングできる人がいないというオチがあるかもしれません(そういうところで活躍したいのか、高いレベルで切磋琢磨したいのかは人それぞれなのでそれの良し悪しを論じたいわけではないです)。
こんな感じで、ある程度感触を掴んでおけば学会でポスター発表している人とかに裏とりの質問したりできますし、コネクションも作りやすくなると思います。
ざっと国内の製薬会社のオープン・イノベーション公募サイトをリストアップしてみましたが、TaNeDS(タネデス)なんかはニーズ集約っぽいですね。
それではカラピンチャなどお待ちしています。
23042020 bioinformatics
なんかのアンケートに回答したらアマゾンギフト券が送られてきたので本を購入。
マルチオミクスの号はまだ読んでない。
22042020 chemoinformatics q-chem
私の一番大きな興味は蛋白質と低分子化合物の相互作用を如何に深く理解するかってことで、最近は量子化学のパラメータを記述子として使ったりしてるんだけど、ガチ量子系の研究者の言ってることがにわかの私には理解できないことがたまにある。
最近であったconfusionは励起状態への遷移に伴うインデュースドフィットの描像が古典力学の解釈でのそれとはなんか違うような気がして時間的な変化どうなってんのかねーという疑問が湧いたので、この本を読み直している。
レチナールとか視覚系は量子化学的な取り扱いしないといけないとは思っているけど、普通の低分子化合物の場合はどこまで非占有有軌道が効いてくるのか興味があるところ。
19042020 bioinformatics
Attention関連の調べ物をしていた。
でその上で、Compound-protein interaction prediction with end-to-end learning of neural networks for graphs and sequences.を読んだ感想となる。
引っかかったのは表題の通りで、Fig.9 (A)でcorrectly capture the interaction sitesってなってるけど、この領域はATPの結合サイトだろうからキナーゼ間で強く保存されているはずで、単にAttentionでひっかかっただけではなかろうか?学習できたというよりはデータのバイアスでそれっぽく見えたと考えるほうが自然かなぁ。右上のほうのアルファヘリックスもinteractionには関係なさそうだけどattentionでひっかかっているのでなんとなくそうっぽいし、実際に訓練セットでマルチプルアライメントしたら高度に保存されている領域として出てこないだろうか?
一方で、フラグメントスクリーニングのような多量の結合データにおいてはこういう手法は面白いのかなーと考えている。こういったものに適応できればいい感じだし。
ただ、その場合蛋白質側が文字列でうまくいくのかなー?っていう疑問は残る。この場合は、Conclutsionに記載されているように3Dで学習させてみて、って感じでしょうかね?
However, the development of GNN for 3D structured proteins is an important challenge; in particular, we believe that such a ‘3D GNN’ will allow us to achieve higher performance, provide more detailed analysis, and obtain more useful information for 3D interaction sites between compounds and proteins derived from the perspective of data-driven machine learning approach.
それでも過度な抽象化しているような気はするけど。