顧客の要件をきちんと理解すること

顧客が本当に必要だったものという風刺画はだれでも一度は目にしたことがあるだろう。

顧客はそもそも自分が欲しい物をきちんと理解していないことが多いため、自分の理解の範囲で要望を伝えることに問題があるし、それを字面通りに受け取るプロジェクトリーダーが要求の本質を理解していないということも同様に問題かと思う。解析という仕事においても同じことはあてはまる。特にケモインフォやバイオインフォの解析において、顧客はメディシナルケミストだったり、薬理の研究者だったりするわけだが、かれらの要求(知りたいこと)を彼ら自身がきちんと認識していないことは往々にしてある。

もし、こうい解析タスクが割り当てられて、その評価に労働時間が考慮されているのであれば、間違ったことを繰り返すことになんの問題もない、むしろ沢山の間違いを繰り返して、顧客から労働対価をぶんどるのは正しい戦略かと思う。社内においても「依頼されたタスク」を遂行する、そしてその時間の多寡が評価されるのであれば、特段問題ないと思う。

ただ、既にWFHが当たり前になりつつ状況で労働時間そのものを評価の指標にすることは減ることはあれど、増えることはないと思う。つまり「顧客が本当に必要だったもの」をいかに早く少ない労力で提供するかが評価指標にシフトしていくんだろうなぁと思っている。

最近、いくつかのミーティングに出ていて、 「それそのまま鵜呑みにして実行したら、そりゃそういう話に持っていかれるだろうな」 と思うことがいくつか重なったのでメモがてら書いてみた。

今月の分子で興味をひかれたもの

PDBjの今月の分子を眺めて興味が湧いたもののメモ

tRNA

下の図は、PDBエントリー 4tna のフェニルアラニン運搬RNAの構造で、3つの塩基の相互作用を示している。シトシンとグアニンは、DNAでも見られる典型的な塩基対を形成するが、2つ目のグアニンはメチル基(右端中央の灰色の球)が付加されており、通常見られない相互作用を塩基対と形成する。

FMO案件

シャペロン

シャペロンも改めて考えてみるとよくわからん。フォールディングしやすく空間を与えるのか、熱変性しにくくする空間を与えるのか?HSPの名前の由来であれば後者の気もするけど。

多くのシャペロンタンパク質は「熱ショックタンパク質」(heat shock protein)と呼ばれ、HSP-60のように名付けられている。こう呼ばれるのは細胞が熱にさらされた時大量に作られるからである。一般的に熱はタンパク質を不安定化させ、誤った折りたたみをより起きやすくしてしまう。だから本当に熱くなった時、細胞はこれらシャペロンの追加支援を必要とするのである。

Gタンパク質

G蛋白質をあまり丁寧にみたことはなかった。

βサブユニットを見ることにも時間を費やして欲しい。ペプチド鎖を主鎖表現やリボン表現で表示すると、鎖がきれいなプロペラ型の構造をとっているのが分かるだろう

主要組織適合性複合体(Major Histocompatibility Complex)

FMOかけよ

MHCタンパク質は、黄色い星印で示したチロシン(tyrosine)の各末端でペプチドをつかんでいる。2つの構造でこの3つの位置が似ていることに注目して欲しい。ペプチドはこの場所でMHCにつながれているが、他のアミノ酸は外側に伸びてタンパク質から外れている。

オーキシンとTIR1ユビキチンリガーゼ

正しくないフォールディングってのは物性的にわかりやすい駄目な指標があるってことかな?免疫系の抗原提示みたいなことが蛋白質レベルで行われているってことかな?

オーキシンがユビキチンに結合した構造によって別の驚くべきことが分かった。オーキシンは、Aux/IAAタンパク質がリガーゼに結合するのを促してそれらの破壊を導くが、タンパク質の形を変えることでこの仕事を行っている訳ではない。そうではなく、2つの分子の間に架橋する分子のりとして働くのである。オーキシンはユビキチンリガーゼの深い窪みの中に結合して穴を埋め、Aux/IAAタンパク質に完全に合致した表面を作り出す。

低酸素誘導因子

虚血も興味がある。

酸素が不足した細胞は、多くの赤血球を生み出しより多くの血管をつくるよう身体に伝える信号を送り出す。また、代謝のしくみを変えて、あまり多くの酸素を必要としないエネルギー代謝経路を使うようにする。

スプライソソーム

わからん

細胞の分子生物学の「細胞の内部構造」のパートを精読してた

ちょっと色々調べないといけなかったのだが、知らんことが多すぎたので週末は細胞の分子生物学の「細胞の内部構造」のパートを精読していた。

  • 10: 膜の構造
  • 11: 少分子の膜輸送と膜の電気的性質
  • 12: 細胞内区画と蛋白質の選別
  • 13: 細胞内における小胞の移動
  • 15: 細胞の情報伝達

ProductName 細胞の分子生物学
ニュートンプレス / ¥19,800 (2010-01T)

ゲノム系計算科学

筆者らはバイオインフォマティクスを「DNAやアミノ酸の配列情報を主に文字の配列と見てその検索や文法を解析する学問」とするのに対し、ゲノム系計算科学を「ゲノムを物理的実体と見て自然科学的に理解するための学問」としている。

DNAとそれに結合するタンパク質の間の電気的相補性はどうも分子認識の特異性にはあまり関係しないと考えられる。

このあたりですね。

色々と面白いことが書いてあったが、膜貫通蛋白の構造生物学が好きな人向けかな。

ゲノムデータ解析

GWAS関連の解析の具体的な方法や、そのためのRパッケージの紹介など、GWAS関連の論文を読むときに知っておくといいことがわかりやすく説明されているので良かった。

これが一番現場向けかもしれないが、Haploviewの結果の読み方の説明などはないので、そのあたりもう少し厚めに解説してあると嬉しかったかも。とはいえそんなのは自分で調べればいいだけなので、調べるべきことのポインタが示されている本書は重宝するだろう。

ProductName ゲノムデータ解析 (統計学One Point 1)
共立出版 / ¥2,420 (2016-09-08)

ちなみに私くらいの知識だと遺伝統計学入門を行ったり来たりしながら読み勧めないといけなかったので、別途入門書は必要かなとは思う。

ゲノム医学のための遺伝統計学

読んだ。

GWASのあたりをわかりやすく解説していたので非常に良かった。

分子細胞免疫学 原著第9版を読み終えた(1周目)

半年以上前に購入した分子細胞免疫学をやっと読み終えた

ProductName 分子細胞免疫学 原著第9版 アバス–リックマン–ピレ
エルゼビア・ジャパン株式会社 / ¥10,780 (2018-03-15)

補体のあたりから苦行すぎてちょっと投げ出してた。だって、蛋白質のメカニズム(物理化学的な)やつにあてはめると疑問符が付きまくる事象を覚えないといけないなんて、まるで、歴史とか地理の暗記してるみたいだし、、、

で、以下の本を副読本として読んだら、分子細胞免疫学の内容も理解しやすくなった。素晴らしい。

これであと2周くらいは読める。次は、気になった蛋白質をPDBで検索しながら読むことになると思う。

昔、CD14とかTLRの立体構造予測をしていたことがあってLRR(ロイシンリッチリピート)っていうなんかダンゴムシみたいな構造キモいなと思っていたんだけど、今回勉強し直して、あのドメインは自然免疫系としては実に理にかなった構造ではないか!と感動したのであった。

Pharmahack(Open Innovation)

在宅勤務+GWのコンボで暇なので駄文を書いてみることにしました。だらだらと調べ物をしてたり、文章の推敲をしていたらあっというまに3時間くらい消費してしまったので、もし役に立ったらこのあたりからパンダンリーフとかカラピンチャとか乾燥ポルチーニを送りつけてもらうと嬉しいです。

または代わりにビールでも注文してあげてください(たいてい、週末の帰りにここで一杯飲みながら今日のような内容を考えているのでお店に貢献したい)。

尚、このエントリはとりあえず製薬企業に入りたいとかいう修士向けの内容ではなくて、ジョブディスクリプション型の応募、つまり、製薬企業の研究開発職にポスドクから転身したいとか、他社へ転職したいとかいう人向けのハックだと思っています。

ざっくり言うとオープン・イノベーションのサイトを眺めて企業の内情を想像しようって話です。

企業のR&D報告書はチェックする

たいていの製薬企業が毎年報告するR&D報告書は押さえましょう。R&Dとして長期的に進みたい方向が示されているので、自分のやりたいことと企業の進む方向性にずれがないかはこのあたり読んでいるとわかります。ただし成果報告については現場のお化粧がマシマシされていたり、トップ層の夢がまぶされていることが多いので、額面通りに受け取るのは危険です。他社でも内情知ってると「うわー、そこ盛っちゃうか!」とか「あれ、その領域辞める方向で進んでるんじゃなかったっけ、とりあえずアピールだけかな?」とかわかるので、前職などのR&D報告はフィクションとして楽しめたりしますw

概ねR&Dトップの意思や目指す方向はその企業の進む方向なのでこれを理解しておくことは重要です。

オープン・イノベーションサイトの読み方、使い方

「製薬企業、オープン・イノベーション」で検索をかけるといくつか解説がヒットするのでまずは目を通しましょう

背景としては大体こんな感じで、外部との連携をスムースに行うためにオープン・イノベーション担当部署が設置されて、外部からの提案を広く受け付けるために公募サイトが設置されることになります。ただし公募サイトはなんでもうけつけるわけではなく、先ほどでたような企業の成長方向に沿ったもの(R&D報告書に記載している)になると思います。

このとき、R&Dの成長戦略に沿ってオープン・イノベーション担当部署が独立して動くようであればベンチャーキャピタル(VC)の様相を呈して、案件の評価もほぼ独立して担当することになるでしょう。つまりこのスライドの11枚目のベンチャー活用型オープン・イノベーションというやつです。この場合は外部の提案に対し、Go/No-goの判断をするだけなのであまり見るべきところはありませんが、単独で評価できる能力があるということは相当優秀な人材を集めたなぁとは思うのでVC的な仕事がしてみたければこういうところに潜り込むことを考えても良いかもしれません。

さて、先のスライドのもう一つのほう、産学連携型オープンイノベーションというのが今回のポイントとなります。

スライドでは

日本では創薬ベンチャーの育成が十分でなく、学の優れた成果を産に活かす産学連携が革新的な医薬品開発の推進に必須であると考える

と書いてありますが、要は産学共同で企業のニーズに合った技術革新を行ってお互いハッピーになりましょうということだと思います。この場合、ニーズは現場から吸い上げられオープン・イノベーション担当部署にてまとめられるので、そのリストは近視眼的で生々しい(具体的な)ものとなりがちです。つまり、現時点で現場が困っていて解決したい案件がニーズとしてあがりがちだということです。

重要な点は、ニーズ提案部署の能力の限界をそこから見積もることができるということです。もし、そのニーズがstate-of-the-art(SOTA)を超えたところにあり、自分のスキルやチャレンジの方向が一致していると、そういうところで働くとハッピーになれる可能性が高いでしょう。あとは募集が出てなくてもコネをたどるとなんとかなることもあるでしょう。(現場からすると協業でも人材獲得でもそんなに大差ないし、欲しいのはそういう技術をもった人材なので)

逆にSOTAに遠く及ばんだろみたいなウィッシュが上がっていたりすると、チームのレベルがそれほど高くない可能性があったり、AIが云々とかの抽象的すぎる大雑把なニーズだったりするとニーズ提案部署にプログラミングできる人がいないというオチがあるかもしれません(そういうところで活躍したいのか、高いレベルで切磋琢磨したいのかは人それぞれなのでそれの良し悪しを論じたいわけではないです)。

こんな感じで、ある程度感触を掴んでおけば学会でポスター発表している人とかに裏とりの質問したりできますし、コネクションも作りやすくなると思います。

ざっと国内の製薬会社のオープン・イノベーション公募サイトをリストアップしてみましたが、TaNeDS(タネデス)なんかはニーズ集約っぽいですね。

それではカラピンチャなどお待ちしています。

実験医学を何冊か購入

なんかのアンケートに回答したらアマゾンギフト券が送られてきたので本を購入。

マルチオミクスの号はまだ読んでない。

配列のアテンションで立体構造まで言及できるのだろうか?

Attention関連の調べ物をしていた。

でその上で、Compound-protein interaction prediction with end-to-end learning of neural networks for graphs and sequences.を読んだ感想となる。

引っかかったのは表題の通りで、Fig.9 (A)でcorrectly capture the interaction sitesってなってるけど、この領域はATPの結合サイトだろうからキナーゼ間で強く保存されているはずで、単にAttentionでひっかかっただけではなかろうか?学習できたというよりはデータのバイアスでそれっぽく見えたと考えるほうが自然かなぁ。右上のほうのアルファヘリックスもinteractionには関係なさそうだけどattentionでひっかかっているのでなんとなくそうっぽいし、実際に訓練セットでマルチプルアライメントしたら高度に保存されている領域として出てこないだろうか?

一方で、フラグメントスクリーニングのような多量の結合データにおいてはこういう手法は面白いのかなーと考えている。こういったものに適応できればいい感じだし。

ただ、その場合蛋白質側が文字列でうまくいくのかなー?っていう疑問は残る。この場合は、Conclutsionに記載されているように3Dで学習させてみて、って感じでしょうかね?

However, the development of GNN for 3D structured proteins is an important challenge; in particular, we believe that such a ‘3D GNN’ will allow us to achieve higher performance, provide more detailed analysis, and obtain more useful information for 3D interaction sites between compounds and proteins derived from the perspective of data-driven machine learning approach.

それでも過度な抽象化しているような気はするけど。