Drkcore

ゲノム系計算科学

筆者らはバイオインフォマティクスを「DNAやアミノ酸の配列情報を主に文字の配列と見てその検索や文法を解析する学問」とするのに対し、ゲノム系計算科学を「ゲノムを物理的実体と見て自然科学的に理解するための学問」としている。

ゲノム系計算科学 ―バイオインフォマティクスを越え,ゲノムの実像に迫るアプローチ― (計算科学講座 7)
共立出版 / ￥4,180 (2013-01-23)

DNAとそれに結合するタンパク質の間の電気的相補性はどうも分子認識の特異性にはあまり関係しないと考えられる。

このあたりですね。

色々と面白いことが書いてあったが、膜貫通蛋白の構造生物学が好きな人向けかな。

30042020 bioinformatics

ゲノムデータ解析

GWAS関連の解析の具体的な方法や、そのためのRパッケージの紹介など、GWAS関連の論文を読むときに知っておくといいことがわかりやすく説明されているので良かった。

これが一番現場向けかもしれないが、Haploviewの結果の読み方の説明などはないので、そのあたりもう少し厚めに解説してあると嬉しかったかも。とはいえそんなのは自分で調べればいいだけなので、調べるべきことのポインタが示されている本書は重宝するだろう。

ゲノムデータ解析 (統計学One Point 1)
共立出版 / ￥2,420 (2016-09-08)

ちなみに私くらいの知識だと遺伝統計学入門を行ったり来たりしながら読み勧めないといけなかったので、別途入門書は必要かなとは思う。

遺伝統計学入門 (岩波オンデマンドブックス)
岩波書店 / ￥4,950 (2015-12-10)

29042020 bioinformatics

ゲノム医学のための遺伝統計学

読んだ。

ゲノム医学のための遺伝統計学 (クロスセクショナル統計シリーズ 3)
共立出版 / ￥3,300 (2015-03-24)

GWASのあたりをわかりやすく解説していたので非常に良かった。

27042020 bioinformatics

分子細胞免疫学原著第9版を読み終えた(1周目)

半年以上前に購入した分子細胞免疫学をやっと読み終えた

分子細胞免疫学原著第9版アバス–リックマン–ピレ
エルゼビア・ジャパン株式会社 / ￥10,780 (2018-03-15)

補体のあたりから苦行すぎてちょっと投げ出してた。だって、蛋白質のメカニズム（物理化学的な）やつにあてはめると疑問符が付きまくる事象を覚えないといけないなんて、まるで、歴史とか地理の暗記してるみたいだし、、、

で、以下の本を副読本として読んだら、分子細胞免疫学の内容も理解しやすくなった。素晴らしい。

好きになる免疫学第2版 (KS好きになるシリーズ)
講談社 / ￥2,420 (2019-03-27)

これであと2周くらいは読める。次は、気になった蛋白質をPDBで検索しながら読むことになると思う。

昔、CD14とかTLRの立体構造予測をしていたことがあってLRR(ロイシンリッチリピート)っていうなんかダンゴムシみたいな構造キモいなと思っていたんだけど、今回勉強し直して、あのドメインは自然免疫系としては実に理にかなった構造ではないか！と感動したのであった。

26042020 work

GWに読むといい本

問題を理解していないと悲しいことになるので、そういう事態を避けるために読んでおくと良い本を三冊紹介したいと思う。すべて名著です。

試験計画をたてるならとりあえずやってみるではなくて、何と何の違いを見てどうなることを期待するくらいは持っていて欲しい。結果出したいんか、時間を消費したいのかよくわからんやつ多すぎやぞ、最近。できるだけ無駄な時間を使わないで結果出すのがベストだと思うんやけどね、、、
— kzfm (@fmkz___) April 23, 2020

いかにして問題をとくか

古典だけど名著。娘が高校生になったら読ませようと決めている本。

問題を理解しなければならない
データと未知のものとの関連を見つけなければならない、関連がすぐわからなければ補助問題をかんがえなければならない。そうして解答の計画をたてなければならない
計画を実行せよ
えられた答えを検討せよ

いかにして問題をとくか
丸善 / ￥1,650 (1975-04-01)

イシューからはじめよ

私は発売と同時に買ったから10年くらい前に読んだ。レビューは検索かけると色々出てくるのでそっちをあたってほしい。製薬系の研究者でもこのあたり意識できると生産性が全然変わるでしょう。

イシューからはじめよ ― 知的生産の「シンプルな本質」
英治出版 / ￥1,782 (2014-09-01)

アブダクション

去年の同じような時期にもおすすめした気がするけどいい本なので。上の2冊が問題解決の手段を与える本なのに対し、こちらは問題そのものを探したり、仮設構築の論理を話題にしている。

「アブダクション」を読んだ

アブダクション―仮説と発見の論理
勁草書房 / ￥3,080 (2007-09-20)

サイエンティストとしては道を切り開かなきゃですよね。

An answer is always the stretch of road that's behind you. Only a question can point the way forward.

Hello? Is Anybody There?
Orion Children's Books / ￥649 (1998-08-03)

25042020 chemoinformatics bioinformatics

Pharmahack(Open Innovation)

在宅勤務+GWのコンボで暇なので駄文を書いてみることにしました。だらだらと調べ物をしてたり、文章の推敲をしていたらあっというまに3時間くらい消費してしまったので、もし役に立ったらこのあたりからパンダンリーフとかカラピンチャとか乾燥ポルチーニを送りつけてもらうと嬉しいです。

または代わりにビールでも注文してあげてください（たいてい、週末の帰りにここで一杯飲みながら今日のような内容を考えているのでお店に貢献したい）。

3L弱でこの値段はお得なのでGWの家飲みに注文かけておくと良いかと思います。https://t.co/M7fqIgLdHZ
— kzfm (@fmkz___) April 24, 2020

尚、このエントリはとりあえず製薬企業に入りたいとかいう修士向けの内容ではなくて、ジョブディスクリプション型の応募、つまり、製薬企業の研究開発職にポスドクから転身したいとか、他社へ転職したいとかいう人向けのハックだと思っています。

ざっくり言うとオープン・イノベーションのサイトを眺めて企業の内情を想像しようって話です。

企業のR&D報告書はチェックする

たいていの製薬企業が毎年報告するR&D報告書は押さえましょう。R&Dとして長期的に進みたい方向が示されているので、自分のやりたいことと企業の進む方向性にずれがないかはこのあたり読んでいるとわかります。ただし成果報告については現場のお化粧がマシマシされていたり、トップ層の夢がまぶされていることが多いので、額面通りに受け取るのは危険です。他社でも内情知ってると「うわー、そこ盛っちゃうか！」とか「あれ、その領域辞める方向で進んでるんじゃなかったっけ、とりあえずアピールだけかな？」とかわかるので、前職などのR&D報告はフィクションとして楽しめたりしますｗ

概ねR&Dトップの意思や目指す方向はその企業の進む方向なのでこれを理解しておくことは重要です。

オープン・イノベーションサイトの読み方、使い方

「製薬企業、オープン・イノベーション」で検索をかけるといくつか解説がヒットするのでまずは目を通しましょう

背景としては大体こんな感じで、外部との連携をスムースに行うためにオープン・イノベーション担当部署が設置されて、外部からの提案を広く受け付けるために公募サイトが設置されることになります。ただし公募サイトはなんでもうけつけるわけではなく、先ほどでたような企業の成長方向に沿ったもの(R&D報告書に記載している)になると思います。

このとき、R&Dの成長戦略に沿ってオープン・イノベーション担当部署が独立して動くようであればベンチャーキャピタル(VC)の様相を呈して、案件の評価もほぼ独立して担当することになるでしょう。つまりこのスライドの11枚目のベンチャー活用型オープン・イノベーションというやつです。この場合は外部の提案に対し、Go/No-goの判断をするだけなのであまり見るべきところはありませんが、単独で評価できる能力があるということは相当優秀な人材を集めたなぁとは思うのでVC的な仕事がしてみたければこういうところに潜り込むことを考えても良いかもしれません。

さて、先のスライドのもう一つのほう、産学連携型オープンイノベーションというのが今回のポイントとなります。

スライドでは

日本では創薬ベンチャーの育成が十分でなく、学の優れた成果を産に活かす産学連携が革新的な医薬品開発の推進に必須であると考える

と書いてありますが、要は産学共同で企業のニーズに合った技術革新を行ってお互いハッピーになりましょうということだと思います。この場合、ニーズは現場から吸い上げられオープン・イノベーション担当部署にてまとめられるので、そのリストは近視眼的で生々しい（具体的な）ものとなりがちです。つまり、現時点で現場が困っていて解決したい案件がニーズとしてあがりがちだということです。

重要な点は、ニーズ提案部署の能力の限界をそこから見積もることができるということです。もし、そのニーズがstate-of-the-art(SOTA)を超えたところにあり、自分のスキルやチャレンジの方向が一致していると、そういうところで働くとハッピーになれる可能性が高いでしょう。あとは募集が出てなくてもコネをたどるとなんとかなることもあるでしょう。（現場からすると協業でも人材獲得でもそんなに大差ないし、欲しいのはそういう技術をもった人材なので）

逆にSOTAに遠く及ばんだろみたいなウィッシュが上がっていたりすると、チームのレベルがそれほど高くない可能性があったり、AIが云々とかの抽象的すぎる大雑把なニーズだったりするとニーズ提案部署にプログラミングできる人がいないというオチがあるかもしれません(そういうところで活躍したいのか、高いレベルで切磋琢磨したいのかは人それぞれなのでそれの良し悪しを論じたいわけではないです)。

こんな感じで、ある程度感触を掴んでおけば学会でポスター発表している人とかに裏とりの質問したりできますし、コネクションも作りやすくなると思います。

ざっと国内の製薬会社のオープン・イノベーション公募サイトをリストアップしてみましたが、TaNeDS（タネデス）なんかはニーズ集約っぽいですね。

それではカラピンチャなどお待ちしています。

25042020 life

バトゥーキ面白い

嘘喰いの作者の次作。カポエラの話

一巻は期間限定無料で読める。

バトゥーキ【期間限定無料】 1 (ヤングジャンプコミックスDIGITAL)
集英社 / ￥0 (2020-04-17)

バトゥーキ 2 (ヤングジャンプコミックスDIGITAL)
集英社 / ￥564 (2019-01-18)

バトゥーキ 3 (ヤングジャンプコミックスDIGITAL)
集英社 / ￥564 (2019-04-19)

バトゥーキ 4 (ヤングジャンプコミックスDIGITAL)
集英社 / ￥606 (2019-07-19)

バトゥーキ 5 (ヤングジャンプコミックスDIGITAL)
集英社 / ￥606 (2019-10-18)

バトゥーキ 6 (ヤングジャンプコミックスDIGITAL)
集英社 / ￥606 (2020-01-17)

バトゥーキ 7 (ヤングジャンプコミックスDIGITAL)
集英社 / ￥606 (2020-04-17)

23042020 bioinformatics

実験医学を何冊か購入

なんかのアンケートに回答したらアマゾンギフト券が送られてきたので本を購入。

実験医学 2020年5月 Vol.38 No.8 マルチオミクスを使って得られた最新知見〜糖尿病・がん・腸内細菌研究における実例と解析法
羊土社 / ￥2,200 (2020-04-23)

実験医学 2020年2月 Vol.38 No.3 PAIN—痛み〜痛覚システムの最新理解と免疫・がん・多臓器への新たな役割
羊土社 / ￥2,200 (2020-01-23)

マルチオミクスの号はまだ読んでない。

22042020 chemoinformatics q-chem

フロンティア軌道で化学を考える

私の一番大きな興味は蛋白質と低分子化合物の相互作用を如何に深く理解するかってことで、最近は量子化学のパラメータを記述子として使ったりしてるんだけど、ガチ量子系の研究者の言ってることがにわかの私には理解できないことがたまにある。

フロンティア軌道論で化学を考える (KS化学専門書)
講談社 / ￥5,274 (2007-09-27)

最近であったconfusionは励起状態への遷移に伴うインデュースドフィットの描像が古典力学の解釈でのそれとはなんか違うような気がして時間的な変化どうなってんのかねーという疑問が湧いたので、この本を読み直している。

レチナールとか視覚系は量子化学的な取り扱いしないといけないとは思っているけど、普通の低分子化合物の場合はどこまで非占有有軌道が効いてくるのか興味があるところ。

視細胞の光受容メカニズム

19042020 bioinformatics

配列のアテンションで立体構造まで言及できるのだろうか？

Attention関連の調べ物をしていた。

でその上で、Compound-protein interaction prediction with end-to-end learning of neural networks for graphs and sequences.を読んだ感想となる。

引っかかったのは表題の通りで、Fig.9 (A)でcorrectly capture the interaction sitesってなってるけど、この領域はATPの結合サイトだろうからキナーゼ間で強く保存されているはずで、単にAttentionでひっかかっただけではなかろうか？学習できたというよりはデータのバイアスでそれっぽく見えたと考えるほうが自然かなぁ。右上のほうのアルファヘリックスもinteractionには関係なさそうだけどattentionでひっかかっているのでなんとなくそうっぽいし、実際に訓練セットでマルチプルアライメントしたら高度に保存されている領域として出てこないだろうか？

一方で、フラグメントスクリーニングのような多量の結合データにおいてはこういう手法は面白いのかなーと考えている。こういったものに適応できればいい感じだし。

Main protease structure and XChem fragment screen

ただ、その場合蛋白質側が文字列でうまくいくのかなー？っていう疑問は残る。この場合は、Conclutsionに記載されているように3Dで学習させてみて、って感じでしょうかね？

However, the development of GNN for 3D structured proteins is an important challenge; in particular, we believe that such a ‘3D GNN’ will allow us to achieve higher performance, provide more detailed analysis, and obtain more useful information for 3D interaction sites between compounds and proteins derived from the perspective of data-driven machine learning approach.

それでも過度な抽象化しているような気はするけど。

もう5年目(wishlistありマス♡)
最近はPythonとDeepLearning
日本酒自粛中
ドラムンベースからミニマルまで
ポケモンGOゆるめ