RでGEOのデータ解析チュートリアルをやってみた

朝からQM関連の論文読みまくってちょっと疲れたので写経してみた。Rは作図が楽だし大抵きれいに描いてくれるから良いですよね。

このチュートリアルは大変わかりやすいですが、dplyrとかlimmaはわかっている前提なので別途他のドキュメントで保管する必要があるかもしれないです。

それから、写経して気づいたんですがvolcano plotのとこ多分こうだと思います。

full_results %>% 
+     mutate(Significant = adj.P.Val < p_cutoff & abs(logFC) > fc_cutoff ) %>% 
+     mutate(Rank = 1:n(), Label = ifelse(Rank < topN, Symbol,"")) %>% 
+     ggplot(aes(x = logFC, y = B, col=Significant,label=Label)) + geom_point() + geom_text_repel(col="black")

GSE33126

一通りやったら、YouTubeにもう少し複雑な例を同じ流れでやっている動画があるのでみると更に理解が深まると思います。

このタイミングでまたバイオインフォマティクスにコミットしなきゃならんのかよーとか思っていたけど、実際やってみると色々と新しい発見もあるし生物学はやっぱり面白いですね。

独習 Pythonバイオ情報解析はPythonでシングルセル解析をやりたい人が読めば良いと思う

シングルセル解析をPythonでやりたい人には色々と役に立つことが書いてあると思います。私にとっては7, 10-12章が良かったです。1章から6章はPythonとかPandasの使い方なのでスキップしました。

scanpyの使い方が気になっていたのですが、付録Bに10ページくらいの解説だったけど、もう少しページを割いてもらえると嬉しかったかも。まぁオフィシャルドキュメント読めばいいんだろうけど。

全体的に満足な内容でしたが、

  1. リードのトリミング
  2. ゲノム配列のマッピング
  3. マッピングされたリード数の数え上げ

といった部分は割愛されているのでRNA-Seqデータ解析の内容くらいは理解してある必要があるかもしれません。

独習と銘打ってありますが、Pythonにある程度なれていないとハマるかもしれないなぁと思いました。本書で動作確認したPythonやCondaのバージョンとか各ライブラリのバージョンが明記されていないので、Pyhon3.9.4だとcondaでumap入らなかったりとかconda-forge指定しないといけなかったりとかちょいちょいありました。

それからjupyter notebookを勧めているのにサンプルコードがpyなのは初心者は戸惑うんじゃなかろうかなぁと。ipynb同梱しなかったのはなにか理由があったんですかね?

  • 出力7-24の出力結果間違ってる?
  • 8.1.2 joypy, matplotlib_vennのインストールには -c conda-forgeオプションが必要だった
  • 10.2.3 コンベンショナルな方法で正規化してたが実際はどうするのがいいのか?
  • 11.4 Python3.9.4ではumapをcondaでインストールできなかった。pip混ぜたくないのでスキップした
  • 12.5 SAUCIE後で論文読む

ここで差がつく! 英文ライティングの技術

この本の2章が大変参考になった。

また、この本はまだ半分くらいしか読んでいないが、かなり役に立っている。

シルバー民主主義というよりは民意の高齢化

色々思うところはある。

筆者は現在の状況を政治がマジョリティ(高齢化の世代)によっているだけで主権が高齢者にあるわけではないのでシルバー民主主義という立場をとっていない。というより民意が高齢化しているという表現をしていた。

  • シルバー民主主義とシルバーファースト減少の違いは高齢者に政策決定の主導権があるかどうか
  • シルバー優遇の最たるものが公的年金制度。賦課方式は勤労世代から高齢世代への所得移転
  • 賦課方式が可能なのは経済や人口が右肩上がりの場合

民意の高齢化は当分続くわけだから、ドラスティックに変わらない限り色々難しいことになるんじゃないかなぁ。定年引き上げなんて、生産年齢人口をせこく水増ししてるだけだから根本的な解決にならないだろうし、年金だって払い損だろうしねぇ。

  • 余命比例投票はどうか?
  • シルバー民主主義の下では様々な形で負担の先送りが行われる
  • 「若者も安心できる年金制度を」は根本的に誤っている

AIの話に関しては過剰な期待が含まれているので割り引いて考えないといけないが、まぁ読み物としては面白かった

  • 少子化の要因が6つくらいある
  • 森林税のような少額の課税はこれからも増える
  • 社会保険料は本質的に税金なのに会社員は徴収を実感しづらいから取りやすい
  • AI創薬の話は盛りすぎ(私の感想)
  • 自動車の「所有する価値」は今後どうなるのか?
  • テレワークは少子化対策に有効

期せずしてテレワークが増えたので、出生率増えるんでしょうかね?

ポケモンGO(Lv. 45)

前回から40日くらい。リーダーを50回倒すために下っ端と戦うこと300回。

長かった。

次は卵を孵化させてエクセレントスローを投げまくるだけなので、経験値さえ貯ればレベルアップしそう。

あの子は貴族

読みました。久しぶりに気持ちの良い読後感を得ました。

と同時にBlack mirrorという大変に後味の悪いドラマも見始めてしまった。

Dr.Bonoの生命科学データ解析 第2版

献本ありがとうございます。

初版のサイン入り(#11)本も持っているので変更箇所を見比べながら読んでました。

著者のサイトを見てもらえれば良いと思うが、色々と更新されていました。

個人的には第5章にCHIP-seqの事例が追加されていて参考になりました。

あとはコード書いてるときにフォーマットのスペシフィケーションをすぐに参照できると嬉しいことが多いので重宝しています。

その「決断」がすべてを解決する

Rebuildで触れられていたので読んでみました。最近、「叱らない育児」みたいにコーチング方面に寄せすぎている本が多いので、ああいうのに飽き飽きしている方は読むと良いかもしれません。

絶えずポジティブであることは「問題からの逃げ」

ほんとこれ。

  • よい人生を送るためのカギは「もっと」を気にすることではなく、「もっと少なく」を気にすること
  • ポジティブな経験を求めることは、それ自体がネガティブな経験である
  • 絶えずポジティブであることは「問題からの逃げ」のいち形態であり
  • 僕らの身に降りかかることはコントロールできないが、それをどう解釈するか、どう反応するかはコントロール可能
  • 他人の問題の責任を過度に引き受けない

「良い質問」をする技術

なかなか良かった。

  • 人は質問に支配されている
  • 否定のメッセージが悪い質問を作り出す
  • 良い質問とは「軽い質問を気づきをもたらすように変えたもの」か「重い質問を答えたくなるように変えたもの」
  • コンサルタントはアドバイスをするがコーチはしない
  • ネガティブな質問をしない、そういう場合には未来に向けた質問に変える

ここは退屈迎えに来て

積んであったのでやっと読んだ。たいへんよろしかった。

あの子は貴族も読んでおくべきか、、、