04122013 chemoinformatics work life
忘年会兼打ち合わせ
来年は1/18にやりますのでよろしくお願いします。懇親会は美味しいところにする予定です。
そしてやごみ酒店での打ち合わせは楽しかった
居酒屋っぽくない佇まい
熱燗は将軍という銘柄らしい、冷だと英勲。
いわし山盛り
カレイも山盛り
磯辺揚げ
タコ
スモークサーモンはちょっと塩気が強かった。
一人あたり3KだったのCP高い。
また行きたい
04122013 chemoinformatics work life
忘年会兼打ち合わせ
来年は1/18にやりますのでよろしくお願いします。懇親会は美味しいところにする予定です。
そしてやごみ酒店での打ち合わせは楽しかった
居酒屋っぽくない佇まい
熱燗は将軍という銘柄らしい、冷だと英勲。
いわし山盛り
カレイも山盛り
磯辺揚げ
タコ
スモークサーモンはちょっと塩気が強かった。
一人あたり3KだったのCP高い。
また行きたい
27092013 chemoinformatics Redmine
プロジェクトの成功というのは個人のスキルの継続的な向上に加えて、チームのコミュニケーションを如何に円滑にするかにかかっているかと思う。
まぁ、それは創薬プロジェクトでも一緒なわけで。でコミュニケーションを円滑にするためにそれ用のツールに頼るのがいいかと。
なんかができるのがいいかなと思っている。特に化合物管理システムについては5Wの最後のWHYを記録できないのが問題で、これを記録するような簡単な仕組みがないとコミュニケーションの円滑化につながらないような気がする。
週に一度会議をするとかは一見良い案に見えるけど、現状把握だけで時間を取られるし、そのためのレポート作成時間もバカにならないし、結構コスト高なのではないかなと。
こういうあたりはredmineのようなITSで管理すれば、割りとうまく回りやすいのかなと思っている。というより一人で使っているけど、調子いい。
脱Excel! Redmineでアジャイル開発を楽々管理のフローは創薬のサイクルでも大体同じ流れですね。
まぁPDCAサイクルまわすようなのは大体こんな感じかと。
AZは基本的にはこの考え方だと思います。
アジャイルな創薬ということを考えたらフィードバック結果で合成計画を柔軟に変更できないといけないから、バックログを持っていたほうがいいんだろうなと思う。今の日本だと、合成案考えたヒトが合成するみたいな風潮になっていて、間にレビューもおかないし、柔軟性が足りないし、ケミストの能力がそのままストレートに反映されるのでそれっていいのかなーと思ったりもする。あとは、合成案の批判=ケミストの人格批判みたいに受け取るヒトが多いというのも、案は案として客観的に評価できてない証拠だよねーと。
というわけで、こういったあたりに興味があれば参加してくださると嬉しいです。
(2013.09.27 追記) Redmineの操作に関してはプログラミングのスキルは必要ありませんのでお気軽に(Q&Aに追記しておきました)。
ちなみに懇親会は三島バルという飲み歩きイベントに便乗しまして、二次会どこかに集合してまったりやりたいなと考えています。
06092013 chemoinformatics
2日目のGit入門でFlaskでWiki作るやつにGitを絡めるか、Sphinx+Gitで文書管理みたいな方向にしたら良いのか悩んでいる。
これ聞きたいに投票するかコメント入れてもらえれば考慮します。
それから、10/5は三島バルとぶつかっていて懇親会のお店が取りにくいことが判明したのでバルに混ざって二次会どっか取るとか沼津に移動するかちょっと調整しているので少々お待ちください。まぁバル楽しいのでバルになるかと思いますがw
01092013 chemoinformatics
懇親会のconnpassを用意しましたので参加される方はお早めに申込ください(多分後から追加できないところに予約することになると思うので)
20082013 chemoinformatics
10/5,6@三島です
経緯はこれとかこれを参考に。 論文はA chemistry wiki to facilitate and enhance compound design in drug discovery.なんかを見ていただければと
06082013 chemoinformatics
ワークショップの話を先に進めたいので皆さんで集まって飲みましょうってことで、初めて集まって飲んだ。
色々面白い話が聞けたのだけどそれはこっちに任せた。
前菜頼んだくらいで、あとは飲み続けたのでコスパ高かった。空芯菜の炒めものを見ながらもっと茎のあたりをガッツリ切ってもいいのかと勉強になった(あと葉っぱも減らして茎だけでいいやと)。うちはモロヘイヤも空芯菜も先っぽしか収穫しないので贅沢な使い方をしているなぁと思った。
土日の二日間で組んでみました。
土曜日午後(使ってみようRedmine)
日曜日午前(もくもくと軽いトークを混ぜたもの)
もくもくと好きな事をやってもいいし、普段聞けないことを聞いてもいいような軽い感じの質疑ができるようにします。
何故二日の日程にしたかというと、ベアードビールは昼飲みでしょ!という当たり前の理由はおいておくとして、遠くから来る場合に交渉しやすくする意図もあります。
会場のすぐそばにある楽寿園は動物園とか遊戯があって子供だったら、半日ぐらいは余裕で遊べますし、散歩用の道が気持ちいいので大人がぶらぶらしても楽しいです。日曜日はソフトウェア開発よりなのでその日は参加せず、ひと駅先の沼津から沼津港に向かって深海水族館でもよって沼津港で美味しいものを食べても家族サービスとしていけてますし、修善寺とか熱海のほうをぶらついてもいいかと。尚、土曜日のみだったら東京から日帰りも余裕です(三島は意外に近い)。
つまり、プチ家族旅行を兼ねることでwin-winの関係が築きやすくなるわけですねw。早めに三島に入ってお昼に鰻をたべるというのももちろんアリだと思います。
もし興味があれば10月の前半の週末は空けておいて下さい。参加募集ページができたらまたご案内します。
29072013 chemoinformatics life
ソフトウェアのワークショップに参加してきた、というより発表してきた。
発表は全て面白かったし、懇親会でも色々とフィードバックをいただけたので満足。
私のスライドから
それからMMPのカットのやり方が気に入らないという質問を受けたのでメモっておく。この時もちょっと考えさせられたけど、あそこの会社のヒト結構おもろい。
プロジェクトで使うにはカットのやり方こだわったほうがいいかもしれない、あと置換ルールとして持っておきたいもそのほうがいいでしょうね。
というわけでRDKitのコード追いかけようと思ったら先行者がいたので、エントリ待ちで。
(2013.07.28追記) エントリきた
メディシナルケミストのredmineの使い方をちょっと聞いたんだけど面白くて勉強になりそうなので、今度話してもらおうかなと思っている。帰ったら日にちを調整しようっと。おおっぴらに公開しないでライフサイエンス系限定みたいなATNDないかな。
(お前が言うなと自分で自分に突っ込みをいれつつも)志は高く持ったほうがいいよねとは思う。それから大きな挫折を味わないために小さな挫折をくり返すってのも大切かなと。結局は自分というスタートアップをマネジメントする感覚ですね。
それから、ヒトにフォーカスするとイライラするのでもっとカルチャーにフォーカスするように心がけています。以前の上司がPから移られた優秀なメディシナルケミストの方で、よく文化の醸成ということを口にされていたのでなんとなく背中を見て学んだ感じです。意識高い感じで書いておくとヒトとの出会いは大切ですねw
28072013 chemoinformatics
先週の自分の発表の時、Hさんに複数のMMPを同時にふるようなやり方はうまくいくのか聞かれて、難しいのではないかと直感的に答えたのだけど、お昼寝しながらあの答えで正しかったのかなぁと考えていた。
というより、ゴロゴロしながら考えていたら寝てしまったのだけど。
MMPでコアの構造を考えなくて良いとした場合には再帰的にフラグメントの置換が可能になってしまうので、ちょっとこまる。メチル基3つつけたら3倍の効果がでるかと言われればそれは難しいんじゃないのと。
クラシカルなQSARやれるような場合はそれぞれのフラグメントの効果は独立だからうまくいくんだろうなと思う。
つまりフラグメント-フラグメント相互作用とかフラグメント-コア相互作用なんかを考慮しなくていい場合にはうまくいく感じがする。
FBDDやる場合にはフラグメント-コア相互作用として歪のエネルギーを考慮していますね。
09072013 chemoinformatics Python
pychembldb使えば楽勝だというということの証明をしようと思ったが、意外に面倒くさかった。
という条件でデータを引っ張ってくる。その後構造数<2のファイル(MMPにならない)を削除して、メタデータ(アッセイID, Uniprotのアクセッション番号、一般名称、データ元のジャーナル)を吐き出したあと、活性データをTSVに出力するようにしている。
最初はsdfのほうに活性情報も付けておけば楽勝じゃないかと思ったが、スキーマ見てたら測定タイプが正規化されてないうえに、AssayじゃなくてActivityのほうについてることに嫌な予感がしたので調べた。
やはり、pIC50とIC50が混在してたり、InhibitionとIC50が混在していた。
これはペアに出来ないので僕の場合はpandasでゴニョるのでこうしましたが、PPのスキルが高まっていてこっちでやれるのであればsdfに活性入れておいたほうが取り回しやすいかも。
コードはexamples/recreation.pyにあります。ファイル名があれなのは今朝コードを買いている時にスーパーカーを聴きまくっていたからというわけなので察してください。
09072013 chemoinformatics Python
IC50とKiのトレンドをChEMBLのデータセットから探るという論文を読んでいたら、データ抽出のフィルターにconfidence level == 9を入れていたので、これは何かなぁと。
>>> from pychembldb import * >>> for c in chembldb.query(ConfidenceScore).all(): ... print c.description ... Default value - Target unknown or has yet to be assigned Target assigned is non-molecular Target assigned is subcellular fraction Target assigned is molecular non-protein target Multiple homologous protein targets may be assigned Multiple direct protein targets may be assigned Homologous protein complex subunits assigned Direct protein complex subunits assigned Homologous single protein target assigned Direct single protein target assigned
これはキュレーターが付与してるのかな? そうだとしたらかなりありがたい分類だ。
Direct single protein にアサインされているアッセイ数を調べてみる
>>> from pychembldb import * >>> c9 = chembldb.query(ConfidenceScore).filter_by(description="Direct single protein target assigned").one() >>> len(chembldb.query(Assay).filter_by(confidencescore=c9).all()) 76773