18042021 bioinformatics
シングルセル解析をPythonでやりたい人には色々と役に立つことが書いてあると思います。私にとっては7, 10-12章が良かったです。1章から6章はPythonとかPandasの使い方なのでスキップしました。
scanpyの使い方が気になっていたのですが、付録Bに10ページくらいの解説だったけど、もう少しページを割いてもらえると嬉しかったかも。まぁオフィシャルドキュメント読めばいいんだろうけど。
全体的に満足な内容でしたが、
- リードのトリミング
- ゲノム配列のマッピング
- マッピングされたリード数の数え上げ
といった部分は割愛されているのでRNA-Seqデータ解析の内容くらいは理解してある必要があるかもしれません。
独習と銘打ってありますが、Pythonにある程度なれていないとハマるかもしれないなぁと思いました。本書で動作確認したPythonやCondaのバージョンとか各ライブラリのバージョンが明記されていないので、Pyhon3.9.4だとcondaでumap入らなかったりとかconda-forge指定しないといけなかったりとかちょいちょいありました。
それからjupyter notebookを勧めているのにサンプルコードがpyなのは初心者は戸惑うんじゃなかろうかなぁと。ipynb同梱しなかったのはなにか理由があったんですかね?
- 出力7-24の出力結果間違ってる?
- 8.1.2 joypy, matplotlib_vennのインストールには -c conda-forgeオプションが必要だった
- 10.2.3 コンベンショナルな方法で正規化してたが実際はどうするのがいいのか?
- 11.4 Python3.9.4ではumapをcondaでインストールできなかった。pip混ぜたくないのでスキップした
- 12.5 SAUCIE後で論文読む