Dive into promiscuity cliffs

先週promiscuity cliffsというSBDDerにはちょっと受け入れがたい概念があることを知りまして、帰りの新幹線の中で検索してたらopen accessの論文を見つけた。

Identification and analysis of promiscuity cliffs formed by bioactive compounds and experimental implications

SIにデータがあったのでligand expoのデータを使って検索してみた。

結果はGithubにあげておきました。

Dive into promistuity cliffs

全部で20複合体くらいヒットしたので丁寧に観察してからめぼしいものをFMO計算でもかければいいんじゃないかなと思っている。

論文読んで作業していてちょっと思ったのは

  • cliffの方向わからんと困るつまり活性が大きく上がったのがそれとも下がったのかの方向が必要だなと
  • 例えばシビアな認識するATPポケットみたいなものだったらちょっと構造変わったら軒並み活性減弱とかだと面白くない
  • PAINSフィルターに引っかからないアーティファクトも混じっている可能性は否定できないな

あたり。今回サイエンス的な興味と論文がオープンアクセスだったので、試した結果もオープンにしてみたけど、DIYでできるようなFMOクラスターとかDeepLearning用のGPU計算機とか欲しくなるわ。

奈良なのに吹田とはこれ如何に?

久々に奈良に行ってきました。ケモインフォとかQSARの学会ってほとんど出たことがないんだけど、今回初めて参加したら非常に刺激を受けました。あとは研究室(量子化学)出身者が4人もいてちょっとびっくりしたけど、目指すところがそれぞれ違うので非常に参考になった。

ラーメンでもと思ったら全部休みだったのでうどん屋さんに入ってみたが美味しかった。

1510826788 1510826790

前回のメモがあったので酒屋はすぐに発見。またも山間ですw

1510826793

朝からアクティブ。紅葉が綺麗だった。

1510826795 1510826797

興福寺に寄って阿修羅像をみてから奈良公園の鹿とたわむれ(ない)

1510826800 1510826802

朝も昼もおかゆを食べて春日大社にお参り。「ディープラーニングでイケてる表現学習」思いつきますようにってお願いしておいたw

1510826805 1510826807

もちろんジムにピンクの肥満を置くのも忘れずに。

1510826810 1510826812

閃く鹿

1510826815

せんとくん

1510826818

お昼に麺闘庵に行ったら30人以上並んでいたのでスルーしてカレー。ここは美味しかった。

1510826823 1510826820

まんとくんはベタだったw

1510826826

Activity-Cliffなんて名付けること自体がQSARerにとって甘え

QSAR

似ている化合物は似た活性を示すだろうという仮説

Activity-Cliff

似ている化合物なのに活性に大きく乖離があるという事実

さてここで、

  • 似ている化合物は似た活性を示すという仮説が間違っているのだろうか?
  • 似ているという尺度の定義の仕方に問題があるのだろうか?

後者ですね。

このあたりちゃんと理解しておかないとLOでQSAR使いにくいですよね。 特にインフォ系の化合物の抽象表現として文字列弄っているヒトはケミストリー的な思考をしているわけではないので気をつけたほうがいいかなぁ~と思いました。

富士ラーメンフェスタに行ってみた

富士ラーメンフェスタの二回目があるというのを前日に知り、チラシを眺めていたら「みのまる」が出ていたので行ってみることにした。

尚、「みのまる」に関してはググればよいかと。

みのまると弥栄

1510460538 1510460540

サイダーかんというキラキラ系ジュース

1510460543

行列できていたのは北海道ラーメンの店だけであとはまったりしていた。行列だったら凹むなと思っていたので行ってよかったかな。

1510460547

ラーメンも美味しかった。

エリックサウスでカレー

フィッシュカレー

1510460241 1510460239

あと日本酒

1510460243 1510460245

リパブリューでビール三種

先週、僕が今の職場に移って1周年記念のタイミングでリパブリューが新しくビールを出すということだったので会社帰りに寄ってきた。

ブランク(ホップ)

1509968623 1509968625

ブランク(モルト)とカリーブルスト

1509968627 1509968629

最後にゼロ

1509968631

満足のビールだった。

この1年で3,4年ぶんくらいは働いた感はあるけど、まだまだやり足りないので今後もバリバリ働けたらいいなと思う。今の職場の皆さんには感謝しきれない。

神の子どもたちはみな踊る

読み返してみたけど、結構内容を忘れていた。

ProductName 神の子どもたちはみな踊る (新潮文庫)
村上 春樹
新潮社 / 529円 ( 2002-02-28 )


ポケモンGO(Lv36)

前回から一ヶ月半くらいかかっている。今年中に37に到達できれば十分かな。

1509189608

ちょっとモチベーションが下がっているのは、出張があったり、雨が降って週末が潰れたりとかあったけど、やはり図鑑はやり尽くしたというのは大きい。去年の今頃と同じパターンだな。

サニーゴ取るのが早いか、第三世代に突入するのが早いかといったところ。

雨振るとポケモンボールの調達が出来なくて、ポケゴが役立たずになるのが辛い… 全部ボール投げきってくれればいいのになんで青いのと黄色いのは投げないんだろう。設定に追加してほしいわ。

昨日赤いヨマワルをゲットして、ちょっと満足。

1509189606

rsyncでssh使えるの知らなかった

Dr. Bonoの生命科学データ解析を読み返していたら

rsyncって-eオプションでsshに切り替えられるんじゃん!

と気づいて、ちょっと遅くなりかけてた本番環境のデータを開発環境にリモートコピーするっていうscpの作業をrsyncに切り替えたおかけで差分更新できるようになって超早くなって仕事の効率が上がって嬉しい。

ProductName Dr. Bonoの生命科学データ解析
坊農秀雅
メディカルサイエンスインターナショナル / 3240円 ( 2017-09-29 )


あとついでに職場のubuntu(16.04)調べたらrsh入ってた。デフォルトで入るのかな?

Dr. Bonoの生命科学データ解析

2000の手前くらいから2005のおしまいくらいまでbioinformaticsやっていて、次世代じゃないマイクロアレイとかDNA chipsいじってたくらいで、NGSはDRY本読んだりして押さえてあるけど実務では経験はしてないなーって感じだけど楽しく読みました。

これからバイオインフォマティクスやる人は買って読んでおくべき本かなと思いますね。あとはケモインフォマティクスの人もバイオインフォマティクスは知っておいたほうがいいので読んでおくといいです。両方できると確実に幅が広がるのでキャリア的に有利です。

ProductName Dr. Bonoの生命科学データ解析
坊農秀雅
メディカルサイエンスインターナショナル / 3240円 ( 2017-09-29 )


ざっとバイオインフォマティクスを知るには良い本だと思いました。個別の具体的な問題に答えるというよりは、それらの問題に取り掛かるために知っておかないといけない前提知識を手っ取り早く理解する本という位置づけなのかな。

章立てはこんな感じです。個人的には一章の歴史が面白かった(会社に入ってからバイオインフォマティクスに関与したので自分の関わっている年代の前後がどうだったかをよく知らなかったため)

  • 第1章 生命科学データ解析の歴史
  • 第2章 生命科学分野の公共データベース
  • 第3章 データの形式とその取り扱い方
  • 第4章 基本データ解析
  • 第5章 実用データ解析

第4,5章をきちんと学びたかったらDRY本を読めばいいと思います。

以下、読んでいて付箋を貼ったあたりを。

p.6 表1.3

年表の1990, 1997,2002にBLAST論文の出来事が記述されているのだが、2002年のBLASTで何が起こったのかがわからなかった。読書会で 「マニアしか知らないBLASTの歴史」 みたいなLT希望w

p.15

いきなりsuffix arrayが出てきていたのでざっと知りたければ下の方の高速文字列解析の世界を読むことをオススメします。

p.64

蛋白質構造論文の話は知らなかったのであとでちゃんと把握する。

p.84

~~rsync懐かしかったが、scpにはrsync相当の機能はないのだろうかと思いました。というのは今時のOSだとrsync,rcpはデフォルトでは入らないし、オフになっているのでは(セキュリティの関係で)と思ったので。これに関してはちゃんと調べてないからわからん。rshはデフォルトではオフにはなっているはず~~

追記:ボケてた

その他

最近の出来事なんだけど、同僚に「clustalw入れたら?」ってアドバイスしたら、「それってclustalomegaのことなんですね!」と言われて、調べたらそういうのがあって時代を感じたことがありました。本書にはそのあたりが触れてあってなるほどー!とおもいましたね。

読書会があるそうです。

静岡でやるみたいなので、ホテル取って次の日の旅行計画を立てつつ、バイオインフォマティクスやりにくるのがいいと思います。発表者も製薬企業の一線級の方々が熱い思いを語る感じなので楽しみだしね(ハードルあげdone w)

DRY本

僕は今では実務ではバイオインフォマティクスはやらんのだけど、新規ターゲット探索したりあれやこれやする時に公共データを自由に解析できる手段があると強いのでキャッチアップは出来る限りやっています。ハンズオンは経験値上がりますね。

もちろん読書もおすすめ

ProductName 次世代シークエンサーDRY解析教本 (細胞工学別冊)

学研メディカル秀潤社 / 5832円 ( 2015-10-15 )


高速文字列解析の世界

インフォマティクスはゲノムも蛋白質もヌクレオチドやアミノ酸を文字列として抽象化した後に、ゴニョゴニョ処理するので文字列関係のアルゴリズムにアンテナを張っておいたほうがお得です。

というわけでバイオインフォマティクスに関係なさそうなこんな本もきちんと読んで理解しておく必要があります。