Self-assessment of this year

今年を振り返ると書いたエントリ数は100弱だった。昔は1エントリ/day以上は書いていたので最近はブログに対する意欲は薄れているが、後から振り返るためにもう少し書くようにしたい。

仕事関連

今の会社に入って2年ちょいだけど、今年は成果が沢山でてよかったと思う。チームで社外発表を全部で10以上できたし、来年講演に呼ばれているの確定なの4,5はあるしね。来年も社外発表を通して議論、フィードバックをもらいながら成長していきたい。

または overwhelming growth ってやつ?w

一方で去年の振り返りに埋め込んだTEDの動画にあるように、去年はタイミングが良かったというのもあると思うんですよね。「半歩先の仕事の発表だったからウケた」みたいな。サービスとしてはありなんだろうけど、サイエンスとしてはどうなのかなーと思わなくもない。マジョリティが理解できる程度にしか先に進んでないってことだから、すぐに追いつかれる強みにしかならんのかなーとも思うので、そのあたりも考えていかねばいけませんね。と、そういうことを考えられるようになったのも進捗した結果なのでそれはそれで嬉しいことですが。

来年は 「単純なAI based XX」っていうネタも落ち着いて、ドメイン知識が必要ななにか新しいことをプラスしないと評価されなくなってくるっていうようになるんじゃないかなぁーって思います。特にケミストリーはAIっていう焼畑農業である程度焼き尽くしちゃった感があるしね。そのあたり、少し進めていければいいなと思っています。

あと来年はちょっとBioinformaticsのお手伝いもしないといけないのでそっちもきちんと成果を出せるようにしたいけど。まずは環境を整えないといけないなって感じですね。あとバイオインフォの情報も追いかけないといけないので大変になりそう。

ProductName ビジョナリー・カンパニー2 飛躍の法則
ジム コリンズ
日経BP社 / ?円 ( 2014-08-29 )


あと英語力をもっとあげていきたい。僕もエントリ英語にしようかな。

仕事以外のこと

手術というものを初めて経験した、盲腸だけど。それからPokemon GoのトレーナーレベルがMax(40)に到達したら、あまり運動をしなくなってしまった。良くないのでなにかしないとなーと思っている。

良い科学は差を生む(2)

良い科学は差を生むので我々は良い科学を行わなければならないわけです。

ここに、N先生のありがたいお言葉をあげておきますが、

つまり、「化合物のグラフ表現ではきちんと化合物を記述することができない」ということを意味しているわけです(自明だけどね)。

なので、機械学習を利用してQM9の値を予測するってのはとても違和感がある。ただ、マテリアルインフォ系の方々と話していると「ab initioだと計算時間がかかるからコンベンショナルな計算方法があると嬉しい」っていう理由でこういう方法が望まれているようなので、そういう目的ではありかな?と思う。(適用範囲(aplicability domain)の問題とかもある半経験的な手法とどっちが良いんかな?と思わないでもないが)

でも、創薬系の活性予測とか物性予測という場面においては、量子化学計算の結果から出てくる値(energyとか双極子モーメント)とかを現状のグラフ由来のデータをつかって深層学習にかけると、なんか特徴量でてくるかもみたいな神頼みみたいな仕事はどうかと思う。そもそも潜在的に記述できてないデータをinputに突っ込んで記述できるようになったら錬金術じゃないのか?

むしろ、量子化学計算の結果として出てきたパラメータを機械学習のinputとして利用するように色々工夫したほうが良いのではないかと考えている。リガンドとタンパク質の相互作用が化学反応の一種であるならば非占有軌道を考慮できないと正確な予測はできないと思うしね。

ProductName 基礎量子化学―軌道概念で化学を考える
友田 修司
東京大学出版会 / 4536円 ( 2007-02-01 )


AIをもって鶏を割く

今日はちょっとAIに関する発表をしつつパネルディスカッションに行ってきましたが、色々面白かったので書いておく。

要するにAIっぽい仕事をしている人間を集めてショートトークさせた後、パネルディスカッションするっていう構成だったんだけど、パネラーの中で手を動かせて深層学習、機械学習をわかるのはわたし一人で、残りはネットか本かで知識吸収っていう人たちばかりだったのでパネルディスカッション正直めんどくさいなーとしか思っていなかった。あとは事前打ち合わせなしのガチンコパネルディスカッションだったのでドキドキ感はあった。

最初の質問がいきなり「AI人材を育成するには?」という直球の質問で、私が最初の回答者に指名されたので、うっかりナイーブに「機械学習とか深層学習を学んで後はドメイン知識があればいいんじゃないですかね?」というアホな回答をしてしまった。残りのパネラーもわかってない感じの返答していたけど最後のパネラーが「マインドチェンジする必要があるんじゃないかな」みたいなことを言っていて、「ほう!」となった。これはあーなるほど面白いなと。

で、次の質問が私的にはキタのだけど、それは「AIは結局のところ差別化できない方向にすすむので当社の強みにならないと思うのだけど?」という質問でこれは非常に考えさせられた(5秒位w)。で、私が答えたのは「AIは確かに普遍化して差別化ポイントにはならないでしょう、それは技術でツールだから。でもその技術を以て何を為したいのかにオリジナリティがでるのでは?」という返しが出来て、私は実は賢いんじゃないかと思いました。ついでにすかさず先の「AI人材育成質問」を引き合いに出して「うちのチームは1年半前までは深層学習とかできなかったけど、何を為したいかがはっきりしていたから短期間で成果をだして、今は全員当たり前のように毎日ディープラーニングして課題解決しています」というようなアピール出来たので良かった。でもちょっと持ち上げすぎたので、成果よろしくお願いしたい。

あと全然関係ないけど、いい研究しても伝わらないと意味がないので、伝える努力もしたほうがいいかなと思います。よっぽど発表慣れしている人でなければ資料とかポスターのver. 5までは下書きです。査読者のコメントに熟慮を重ねないといけません。学会ポスターなんて多面最適化と一緒であっちの文言帰るとこっちの文言の整合性が取れなくなるし、図をいじると他のデザインとの整合性がとれなくなるので、納得いくまでいじるもんじゃないかなーと思っていたのだけど、こっちの会社に来てみなさんサクッとドラフトっぽいものを印刷出すのでそういう文化なのかなーということで納得しようとしていたら、帰りに一緒に飲んだ同僚(今日の発表資料をさんざん直された)に「そんな文化ないっすよ!」って言われたので書いておきます。

ver. 3で諦めて印刷にまわすのはスラムダンクの三井以下やぞw

今日思いついた一番の名言やと思いましたw

それから前の会社でみんなで心がけてた標語を思い出したのでこれも書いておきます。

「理解されてアドバイスもらえるのがベスト、わかってもらうのがベター、わかった気にさせるのがマスト」

まぁそんな感じです

日本酒バー

無事に役割を果たしたので、帰りにちょっと寄った。

1541818926 1541818928

羽屋はシュワシュワしていて美味しかった。

1541818931 1541818933

今回は色々勉強になってよかったかな。

コアとコンテクスト(ノンコア)については良く考えよう

ジェフリー・ムーアのキャズムは古典だと思う。

ProductName キャズム
ジェフリー・ムーア
翔泳社 / ?円 ( 2002-01-23 )


読んでない人は一度は目を通すべきでしょう。図書館にもあるだろうし、借りて読めばOK。

コアとコンテクストはよく考えたほうがいいでしょう。何がコアなのかは自分たちがどういう強みを持ちたいのか と密接に関連するかと思います。

コンテクストをコアとみなすのは無駄な仕事が増えるだけで、結果忙しくなるだけなので別に構わないけど、コアをコンテクストとみなしてしまうのは、技術力とか強みが一気に劣化するので許容できないですね。

今年を振り返ります

今年を振り返るために、過去のエントリを眺めてみたが、ポケモンGOと食べ物関連のエントリしかなかった。この1年は家であんまりコード書けなかった感じ。職場では結構書いたけど来年はもう少し公開できるようなコードを書ければいいなと思っています。食べることに関しては引き続き美味しいものを開拓していきたい。

ポケモンGOに関しては今1000万XP弱で再開した時点で250万XPくらいだったので、どんだけやったんだ?って感じ。LV40まであと1000万XPなので週末の運動がてら継続したい。

仕事関連

今年は色々と新しい取り組みが出来て良かったと思っている。チームの皆さんに助けられて、大きな前進が幾つかあったし、自分たちのチームのプレゼンスも高められたと思っている。

色々とタイミングが良かったのだろうと思っている。そして企業のなかのチームっていうのはある意味スタートアップみたいなもんだけど、スタートアップと違うのはタイミングよりもチームのほうが重要なんじゃないかなと。良いチームだからうまくタイミングを見極められるのではないのかなーと。実際、全てそうだったしね。下のTEDはためになると思うので一度は聞いておくことをオススメします(7分弱だし)。

それから「誰をバスに乗せるか」はやっぱり重要なんだなーと感じたけど、そういうバスを用意するかというあたりも今後考えなきゃならないんだろうなぁとは感じている。

ProductName ビジョナリー・カンパニー2 飛躍の法則
ジム コリンズ
日経BP社 / ?円 ( 2014-08-29 )


他にはこのあたりを実践して、OSQAと社内twitterを導入してみたところ、色々とつながりも増えたし、よいアイデアやソリューションもシェアリング出来てよかったかなと思った。それからイントラGithubクローン便利すぎ。この1年でシステム周りが改善されて快適にコード書いたり、計算できるようになったかなと。

仕事以外のしごとっぽいこと。

mishima.sykのサイトを作った。これもコミュニティが良いから継続できてていいですね。来年も皆さんで集まれたら良いなと思います。

Bioinformatics関連

Dr. Bonoの生命科学データ解析-読書会に参加してバイオインフォ愛が戻ってきたのと、今後に関してちょっと思うところがあって、余裕があればターゲットファインディング周りも少し手を付けていきたいなぁと思った。open target platformなどのAPIついてるサービスを上手く活用できないとなーと思っている。

ただ、周りの状況を聞いていると、今の状況って僕がバイオインフォをやっていたポストゲノムって言われてた15年くらい前にやっていることと基本変わってないので(だから余裕でついていけるw)機械学習というよりはアブダクション的な手法が求められるのかなーという気はちょっとしている。最近の状況丁寧にサーベイしているわけではないから間違っているかもしれないけど、ターゲットファインディングが相変わらず難しいという状況には変わらないのかなと。

ProductName アブダクション―仮説と発見の論理
米盛 裕二
勁草書房 / 3024円 ( 2007-09-20 )


それではまた来年もよろしくお願いします。

いまさらビッグデータのこと

ビッグデータという5年ぐらい前に流行った言葉が最近この業界で流行っているので、なんだかなーと思いつつ昔買った本を読み直してみた。

ProductName ビッグデータの衝撃
城田 真琴
東洋経済新報社 / ?円 ( 2013-05-02 )


  • 3Vに照らし合わせて、ビッグデータと呼んでもいいねと思える生命科学関連データって実際どんなものがあるのだろうか?
  • データが増えることで、新たな知識の発見に繋がる可能性のあるビッグデータはどのVなのだろうか?
  • pubmedのような自然言語のデータはビッグデータと呼ぶのだろうか?

Wikipediaによると

ビッグデータ [1][2](英: big data)とは、市販されているデータベース管理ツールや従来のデータ処理アプリケーションで処理することが困難なほど巨大で複雑なデータ集合の集積物を表す用語である。

と定義されているのに、publicなデータベースをビッグデータって呼んでみたり、ビッグデータDBとか言っちゃうのはなんだかなーと思うんだよねー

言葉の乱れはサイエンスの乱れというかきちんと理解していない証拠なんだろうけど。

特に新規疾患ターゲット探索で使う手法って僕がゲノム創薬とかいう名目でバイオインフォマティクスやってた頃に比べて、すごく目新しい手法ってあんまり出てない気がするんだけどそういうわけじゃないのかな?っていうあたりが知りたいんですよね。バイオインフォマティクスとかテキストマイニングとか。

もし土曜日に会う人で、「 俺がレクチャーしちゃる 」っていう方がいたらよろしくお願いします。

コンソとかキャリアとか

分かる人にだけ分かればいい話というか駄文です。ちょっとそれ系の話が続いたので、実際転職して今の会社に入って感じたことをメモっておきます。

コンソの意義は何か?

前の会社も、今の会社も普通にコンソーシアムに入ります。ではコンソーシアムの参加意義は何なのでしょう?

たいてい、「先端技術の導入、プレコンペティティブな知識の共有」といったような如何にもなセンテンスが出てきますが実際は違うと思います。

「周回遅れを避ける」

これに尽きると思います。その技術を持っているのであれば「教えて君」的な人達の相手をする暇なんてありません。独自に進んでいくか、先端を走っている同士で共同研究すればいいので船頭は増やす必要はないです。

なので、新規参入でコンソを利用するのはありだけど、それは先頭を走っているというよりはサイエンティストとしては二流の位置にいるということを強く感じたほうがいいでしょう。

キャリア?

キャリアはキャリアブルスキルの略です、意外に認識されていないことが多いですが。つまり、他社に移ってもそのまま使えるスキルのことだと考えて良いでしょう。

他社に移っても使えるかどうかは、他社の現場のヒトに判断されることが多いと思います(当たり前ですが)

なので、外部発表の機会があれば積極的に発表しておくほうが良いと思います。その会社にマッチするかどうかの判断に使うことも出来ますし、何が出来て何が出来ないか明確になるので先方からどういう技術で来て欲しいというような具体的な話にすぐなるのでわかりやすいです。

外部発表しないで自分を認知してもらうというのは結構ハードル高いと思います。論文出すとかはもちろんありますが、なにかあった時に誘ってくれるのはそういうコネクションなので、そこら辺は若いうちから意識しておいたほうがいいと思います。

なにより、他社の優秀な人達とディスカッションするのは楽しいし、刺激になりますしね☆

なので、興味のある人は観光がてら遊びに来るといいと思います。

Mishima.syk #10やります

次回の日程は7/8(sat)に決定しました。参加登録は以下からお願いします。

2回程ハンズオンが続いたので、今回は発表メインでいこうかと思います。思う存分ネタをぶっ込んで下さい。

僕はpymol関連の話かpygamessをRDKitに対応させた話とかそんなのを出来ればいいなと思っているけど、どっちもまだ実装途中なんだよなぁ。

やごみで打ち合わせ

久々にやごみで。

真鯛とホタルイカ

1494534344 1494534347

ネギトロ

1494534349

尚、次回の勉強会は7/8(sat)の予定です。会場押さえてconpassの用意が出来たらまたアナウンスします。 今回はテーマは特に決まってないので好きなことを喋る会になるかもしれません。