リンパとTregと新しい免疫入門

最近ずっと免疫関連の本を読んでいて「リンパわからん」となっていたのだけど、まるまる一冊リンパの本があったので読んでみたらかなりわかりやすかった。

レビューにもあるように、ちょっと専門的かなと思ったので、前提としてこのあたりは読んで理解している必要があるように思う。

さらによくわからなかったTregについてもちょうどいい本があったので読んだ。こっちはちょっと、Treg発見ストーリーのような読み物色が強かったけど、それだけにわかりやすくTregが説明されていた。これは読んでおくべき本だと思う。 なんどもCD25が出てくるのでこれがIL2Rであることは覚えた。

最後に腸のふしぎも読んだ。これはざっと眺めただけ。

蜘蛛ですがなにか?

最近Netflixで蜘蛛ですがなにか?を見ていて、そこそこ面白いので漫画でも読むかとポチポチしてたら7巻ぐらい購入したところで活字を買っていることに気づいた。まぁ買っちゃったし読むかと読み始めたらなかなかおもしろくて結局先週の土日の2日間で14巻全て読んでしまったのであったw

アニメだと蜘蛛視点のストーリーと、勇者か人の視点のストーリーが交互に展開されていて、脈絡のなさに???となるんだが13巻くらいまで進まないと両者の物語がつながらないですね。そこまでアニメが続くのかわからんので読んでおいて良かった感はある。

ポケモンGO(Lv. 44)

前回から一ヶ月弱でレベルアップ。トレーナーバトルだるかった。

次のレベルまでのXPはほぼ溜まっているので、後はロケット団倒すだけで一ヶ月もあれば次のレベルには上がりそう。

ラブラブカップをやるべきか、、、

就職Hacks (製薬企業のDryポスト)

製薬企業でDryのポストを狙っている学生の方々は、おそらくバイオインフォマティクスやケモインフォマティクスの研究室に在籍しているか、ウェットの研究室の担当でDry解析も掛け持ちしているとかだと思います。なので、NGS解析用の既存のコードをモディファイするなり、研究室でメンテされているコードをちょいちょい書き換えたりして、研究成果を出しているのだと思います。就職活動で製薬企業でDryのポストを得るためには研究成果以外にも解析能力やコーディング能力をアピールできると良いと思いますので、損にはならない(と私が思っている)方法を2つほど紹介したいと思います。

GitHubは使えるようにしておこう

書いてあるとおりそのままです。アカウントがなくて成果物がアップロードされていないとしても、PRやイシューを送ったことがあるかといった経験はあったほうが良いかなと思います。

競技プログラミングにもちょっと手を出しておこう

プログラミングを楽しめるということもDryでやっていく研究者として重要な資質かなと思います。インフォマティクス系のポジションを狙っている場合、もしかしたらアルゴリズムに関して質問されるかもしれません。そういった場合にある程度基本的なアルゴリズムやデザインパターンなどに関する知識があったほうが良いかなと思います。

競技プログラミングは色さえついていれば良いと思います。無色透明よりは断然マシでしょう。あんまり聞かれることはないと思いますが、もし私が面接官をやれと言われたら間違いなくする質問だと思います。TOEICのスコアと同じくらいにわかりやすい参考値だしね。

Pythonによるバイオインフォマティクス 原著第2版

Pythonによるバイオインフォマティクス 原著第2版の翻訳に関わりました。

バイオインフォマティクスの書籍というとだいたい3つに分類されるかと思いますが、本書は3のカテゴリに入るかなと思います。

  1. アルゴリズムに関して記述してある本、情報科学系の人向け
  2. ユーザーとして解析方法を知りたい人向け
  3. インフラ寄りの立ち位置で、生命科学データベースやウェブサーバーなどを扱いたい人向け

本書の初版に寄せての1文を借りると

本書の主目的は生 物学の問題と解かんとするこれら研究者を助け,プログラミングの初歩をてほどきすることにある.

つまり本書の特徴はBioPythonを通してPythonプログラミングの基本を覚えられるような構成になっています。目次を見ればわかりますが、8章までPythonの説明に当てられており、9章でBioPythonのいろいろな機能が紹介されます。二部ではDB操作(RDB, NoSQL)やWebアプリケーションの構築に触れられています。ただし、NGS解析については触れられていない ですし、機械学習(Scikit-learn)についても触れられていないので、そのあたりに興味のある方は他の書籍を選択したほうが良いでしょう(後ろに載せます)

本書の原著第2版はPythonの2/3について記述されていましたが、翻訳をしている間にPython2系が廃止されたという経緯もあって翻訳は完全にPython3での記述に変更しています。そのためにAuthorのSebastian BassiとSlackで何度もやり取りをして修正したり、ライブラリのバージョンアップで動かなくなったコードを直したりと結構手を入れました(かなり頑張ったのでまえがきに記載してます)

なお,今回の作業では,著者であるSebastian Bassiと頻繁にやりとりし,可能な限り正確な訳出を心がけた。現在では古くなっている情報については,該当箇所を書き換える,あるいは訳注として対応し,単なる原著第2版の邦訳以上のものとなっている。

ちなみにウェブアプリケーションフレームワークはBottleを採用しているのだけど、私はFlask派です。

PythonでNGS解析をしたい人は?

Bioinformatics with Python Cookbookを選択すればいいと思います(私は原著を読んだので翻訳はもってないです)。ただしCookbookと書いてあるように、前提としてある程度Pythonプログラミングができることを要求する本となっています。もしこの本のコードがわからんという人にとってはPythonによるバイオインフォマティクス 原著第2版は良い選択肢になるのではないでしょうか?

また本書はファイルフォーマットの説明があっさりだったので、Dr. Bonoの生命科学データ解析のフォーマットの説明の章を重宝しました。参考までに。

ProductName Dr. Bonoの生命科学データ解析
メディカルサイエンスインターナショナル / ¥3,300 (2017-09-29)

もう一点はシングルセル解析についての記述はありません。そのためScanpyなどに関する説明もありませんのでこのあたりを知りたい人はドキュメントを読んだりコードを追いかけたりする必要があるのではないでしょうか?

ユーザーとして解析方法を知りたい人には

このあたりが鉄板で、レビューもたくさんあるので調べてみてください。個人的にはRNA-Seqデータ解析が一番わかりやすかったです。

ProductName 次世代シークエンサーDRY解析教本
学研メディカル秀潤社 / ¥6,160 (2019-12-12)

「Kaggleで勝つデータ分析の技術」を読んだ

データ分割の考え方とか特徴量作りのコツみたいなのが丁寧に書いてあって大変参考になった。

ある程度Pythonで機械学習をやっている人向けの本ですね。

ProductName Kaggleで勝つデータ分析の技術
技術評論社 / ¥3,428 (2019-10-09)

いつもはランダムフォレストでいいやーって感じなんだけど、ハイパーパラメータのチューニングめんどくさいしXGBoostかLightGBMに改宗したほうがよいのだろうか。

elmとelmo

最近、右四間飛車elmo囲いを指すようにしている。

ProductName とっておきのエルモ (マイナビ将棋BOOKS)
マイナビ出版 / ¥1,372 (2020-07-13)

というわけで、今年はelmでも勉強しようかと思っている。

ProductName 基礎からわかる Elm
シーアンドアール研究所 / ¥2,604 (2019-02-27)

ポケモンGO(Lv. 43)

先週の1/9には到達していたので2日でレベルアップ。

次のレベルまでの経験値は溜まっているのだけど、トレーナーバトルトータル90勝というのがだるすぎてここでとまりそう。

ポケモンGO(Lv. 42)

前回から3日でのレベルアップ。イーブイ進化させるだけだった。

43のタスクは伝説ポケモンを5匹捕獲っていうのがめんどくさい。

ポケモンGO(Lv41)

レベル50まで目指せるようになって、久しぶりのレベルアップ。前回のレベルアップから2年半弱でした。

タダ券でたまにレイドする私にはレイドを30回やれっていうタスクがだるくて時間がかかってしまった。

expはレベル44までは溜まっているみたいなのでそこまではあげたいが、経験値あげをまたしないといけないのはめんどくさいなぁ。