Activity-Cliffなんて名付けること自体がQSARerにとって甘え

QSAR

似ている化合物は似た活性を示すだろうという仮説

Activity-Cliff

似ている化合物なのに活性に大きく乖離があるという事実

さてここで、

  • 似ている化合物は似た活性を示すという仮説が間違っているのだろうか?
  • 似ているという尺度の定義の仕方に問題があるのだろうか?

後者ですね。

このあたりちゃんと理解しておかないとLOでQSAR使いにくいですよね。 特にインフォ系の化合物の抽象表現として文字列弄っているヒトはケミストリー的な思考をしているわけではないので気をつけたほうがいいかなぁ~と思いました。

富士ラーメンフェスタに行ってみた

富士ラーメンフェスタの二回目があるというのを前日に知り、チラシを眺めていたら「みのまる」が出ていたので行ってみることにした。

尚、「みのまる」に関してはググればよいかと。

みのまると弥栄

1510460538 1510460540

サイダーかんというキラキラ系ジュース

1510460543

行列できていたのは北海道ラーメンの店だけであとはまったりしていた。行列だったら凹むなと思っていたので行ってよかったかな。

1510460547

ラーメンも美味しかった。

エリックサウスでカレー

フィッシュカレー

1510460241 1510460239

あと日本酒

1510460243 1510460245

リパブリューでビール三種

先週、僕が今の職場に移って1周年記念のタイミングでリパブリューが新しくビールを出すということだったので会社帰りに寄ってきた。

ブランク(ホップ)

1509968623 1509968625

ブランク(モルト)とカリーブルスト

1509968627 1509968629

最後にゼロ

1509968631

満足のビールだった。

この1年で3,4年ぶんくらいは働いた感はあるけど、まだまだやり足りないので今後もバリバリ働けたらいいなと思う。今の職場の皆さんには感謝しきれない。

神の子どもたちはみな踊る

読み返してみたけど、結構内容を忘れていた。

ProductName 神の子どもたちはみな踊る (新潮文庫)
村上 春樹
新潮社 / 529円 ( 2002-02-28 )


ポケモンGO(Lv36)

前回から一ヶ月半くらいかかっている。今年中に37に到達できれば十分かな。

1509189608

ちょっとモチベーションが下がっているのは、出張があったり、雨が降って週末が潰れたりとかあったけど、やはり図鑑はやり尽くしたというのは大きい。去年の今頃と同じパターンだな。

サニーゴ取るのが早いか、第三世代に突入するのが早いかといったところ。

雨振るとポケモンボールの調達が出来なくて、ポケゴが役立たずになるのが辛い… 全部ボール投げきってくれればいいのになんで青いのと黄色いのは投げないんだろう。設定に追加してほしいわ。

昨日赤いヨマワルをゲットして、ちょっと満足。

1509189606

rsyncでssh使えるの知らなかった

Dr. Bonoの生命科学データ解析を読み返していたら

rsyncって-eオプションでsshに切り替えられるんじゃん!

と気づいて、ちょっと遅くなりかけてた本番環境のデータを開発環境にリモートコピーするっていうscpの作業をrsyncに切り替えたおかけで差分更新できるようになって超早くなって仕事の効率が上がって嬉しい。

ProductName Dr. Bonoの生命科学データ解析
坊農秀雅
メディカルサイエンスインターナショナル / 3240円 ( 2017-09-29 )


あとついでに職場のubuntu(16.04)調べたらrsh入ってた。デフォルトで入るのかな?

Dr. Bonoの生命科学データ解析

2000の手前くらいから2005のおしまいくらいまでbioinformaticsやっていて、次世代じゃないマイクロアレイとかDNA chipsいじってたくらいで、NGSはDRY本読んだりして押さえてあるけど実務では経験はしてないなーって感じだけど楽しく読みました。

これからバイオインフォマティクスやる人は買って読んでおくべき本かなと思いますね。あとはケモインフォマティクスの人もバイオインフォマティクスは知っておいたほうがいいので読んでおくといいです。両方できると確実に幅が広がるのでキャリア的に有利です。

ProductName Dr. Bonoの生命科学データ解析
坊農秀雅
メディカルサイエンスインターナショナル / 3240円 ( 2017-09-29 )


ざっとバイオインフォマティクスを知るには良い本だと思いました。個別の具体的な問題に答えるというよりは、それらの問題に取り掛かるために知っておかないといけない前提知識を手っ取り早く理解する本という位置づけなのかな。

章立てはこんな感じです。個人的には一章の歴史が面白かった(会社に入ってからバイオインフォマティクスに関与したので自分の関わっている年代の前後がどうだったかをよく知らなかったため)

  • 第1章 生命科学データ解析の歴史
  • 第2章 生命科学分野の公共データベース
  • 第3章 データの形式とその取り扱い方
  • 第4章 基本データ解析
  • 第5章 実用データ解析

第4,5章をきちんと学びたかったらDRY本を読めばいいと思います。

以下、読んでいて付箋を貼ったあたりを。

p.6 表1.3

年表の1990, 1997,2002にBLAST論文の出来事が記述されているのだが、2002年のBLASTで何が起こったのかがわからなかった。読書会で 「マニアしか知らないBLASTの歴史」 みたいなLT希望w

p.15

いきなりsuffix arrayが出てきていたのでざっと知りたければ下の方の高速文字列解析の世界を読むことをオススメします。

p.64

蛋白質構造論文の話は知らなかったのであとでちゃんと把握する。

p.84

~~rsync懐かしかったが、scpにはrsync相当の機能はないのだろうかと思いました。というのは今時のOSだとrsync,rcpはデフォルトでは入らないし、オフになっているのでは(セキュリティの関係で)と思ったので。これに関してはちゃんと調べてないからわからん。rshはデフォルトではオフにはなっているはず~~

追記:ボケてた

その他

最近の出来事なんだけど、同僚に「clustalw入れたら?」ってアドバイスしたら、「それってclustalomegaのことなんですね!」と言われて、調べたらそういうのがあって時代を感じたことがありました。本書にはそのあたりが触れてあってなるほどー!とおもいましたね。

読書会があるそうです。

静岡でやるみたいなので、ホテル取って次の日の旅行計画を立てつつ、バイオインフォマティクスやりにくるのがいいと思います。発表者も製薬企業の一線級の方々が熱い思いを語る感じなので楽しみだしね(ハードルあげdone w)

DRY本

僕は今では実務ではバイオインフォマティクスはやらんのだけど、新規ターゲット探索したりあれやこれやする時に公共データを自由に解析できる手段があると強いのでキャッチアップは出来る限りやっています。ハンズオンは経験値上がりますね。

もちろん読書もおすすめ

ProductName 次世代シークエンサーDRY解析教本 (細胞工学別冊)

学研メディカル秀潤社 / 5832円 ( 2015-10-15 )


高速文字列解析の世界

インフォマティクスはゲノムも蛋白質もヌクレオチドやアミノ酸を文字列として抽象化した後に、ゴニョゴニョ処理するので文字列関係のアルゴリズムにアンテナを張っておいたほうがお得です。

というわけでバイオインフォマティクスに関係なさそうなこんな本もきちんと読んで理解しておく必要があります。

GitHubクローンとしてGiteaを使う

GitHubクローンを使いたかったので調べてみたところ次の3つが良さそうだった。

GitLabは有名どころで定番っぽいけど、インストールがめんどくさそう。GitBucketはjavaの環境が必要だけど、今つかっているLinuxにjavaの環境入れるのは手間がかかりそうだったので見送り。

というわけでGo製のGiteaを。

gitea web

とうつだけで、初回はインストールのメニューが起動し大変便利。SQLiteで運用するならこれだけでサクッとインストールが終了するのもいい。

本番環境はsuperviserに管理させていて

[program:gitea]
command=/home/git/gitea web
directory=/home/git
user=git
autostart=true
autorestart=unexpected
stdout_logfile=/home/git/log/stdout.log
stderr_logfile=/home/git/log/stderr.log

これで安定して動いているので快適

Mishima.syk #11やりました

無事に終了しました、参加されたみなさんお疲れ様でした。

今回話すのが忙しくて写真取ってない…

尚、12月には生命科学データ解析本の読書会が静岡で開催されるそうなので、興味のある方は参加すると良いかと思います。僕も行けたら行きます(懇親会は日本酒が美味しいお店になるという噂です)。

ProductName Dr. Bonoの生命科学データ解析
坊農秀雅
メディカルサイエンスインターナショナル / 3240円 ( 2017-09-29 )