富士錦の蔵開き

今年も会社のみなさんと一緒に富士錦の蔵開きに行ってきました。

1552905738 1552905741

色々お話できて濃厚な時間を過ごしました。

1552905734 1552905736

帰りに富士宮をブラブラして、ヨコゼキ寄ったり、さの萬寄ったりできて良かった。

「かんたん出版マニュアル」を読んだ

図書館に本を返しに行ったら、新刊コーナーに置かれていたので借りてみた。5章の「いい本の作り方」が読みたかったんだけどね。

ProductName かんたん出版マニュアル
杉浦浩司 牧村康正(スーパーバイザー)
星雲社 / 1512円 ( 2018-11-07 )


  • 文章の統一に気をつけましょう
  • 本は書き手が楽しむものではなく読み手が楽しむものです
  • 本の構成案を入念に計画する
  • 「の」「が」「は」を多用しないようにする

かなり参考になった。

ワークライフバランスの「バランスを取る」ということ

なんか1週間くらい前にこれについて書かなきゃ!という強い動機があったんだけど、今では全く覚えていないw

まぁ、でも「ほう!」って思う人もいるかもしれないのでちょっと書いておく。

よくワークライフバランスをシーソーに例えて対立するものとして図示するものが多いんだけど、お手玉とかジャグリングもバランスを取る動作の一つだと思います。つまり、仕事に取り組んでいる間は余暇を宙ぶらりんにしてるわけだし、余暇を満喫しているときには仕事から離れていると。

つまり、両者はリズムを取りながら自分の人生そのものを構築しているわけです。たまに仕事が重くなることはあるけどそれは余暇を圧迫して人生を台無しにするものではないし、より重いタスクのほうがジャグリングのやりがいがあるんじゃないかね。

ワークライフシナジーは隠れた名著だと思うので、軽く読んでおくといいと思います。

中古で1円だしコスパ良いよ

Self-assessment of this year

今年を振り返ると書いたエントリ数は100弱だった。昔は1エントリ/day以上は書いていたので最近はブログに対する意欲は薄れているが、後から振り返るためにもう少し書くようにしたい。

仕事関連

今の会社に入って2年ちょいだけど、今年は成果が沢山でてよかったと思う。チームで社外発表を全部で10以上できたし、来年講演に呼ばれているの確定なの4,5はあるしね。来年も社外発表を通して議論、フィードバックをもらいながら成長していきたい。

または overwhelming growth ってやつ?w

一方で去年の振り返りに埋め込んだTEDの動画にあるように、去年はタイミングが良かったというのもあると思うんですよね。「半歩先の仕事の発表だったからウケた」みたいな。サービスとしてはありなんだろうけど、サイエンスとしてはどうなのかなーと思わなくもない。マジョリティが理解できる程度にしか先に進んでないってことだから、すぐに追いつかれる強みにしかならんのかなーとも思うので、そのあたりも考えていかねばいけませんね。と、そういうことを考えられるようになったのも進捗した結果なのでそれはそれで嬉しいことですが。

来年は 「単純なAI based XX」っていうネタも落ち着いて、ドメイン知識が必要ななにか新しいことをプラスしないと評価されなくなってくるっていうようになるんじゃないかなぁーって思います。特にケミストリーはAIっていう焼畑農業である程度焼き尽くしちゃった感があるしね。そのあたり、少し進めていければいいなと思っています。

あと来年はちょっとBioinformaticsのお手伝いもしないといけないのでそっちもきちんと成果を出せるようにしたいけど。まずは環境を整えないといけないなって感じですね。あとバイオインフォの情報も追いかけないといけないので大変になりそう。

ProductName ビジョナリー・カンパニー2 飛躍の法則
ジム コリンズ
日経BP社 / ?円 ( 2014-08-29 )


あと英語力をもっとあげていきたい。僕もエントリ英語にしようかな。

仕事以外のこと

手術というものを初めて経験した、盲腸だけど。それからPokemon GoのトレーナーレベルがMax(40)に到達したら、あまり運動をしなくなってしまった。良くないのでなにかしないとなーと思っている。

良い科学は差を生む(2)

良い科学は差を生むので我々は良い科学を行わなければならないわけです。

ここに、N先生のありがたいお言葉をあげておきますが、

つまり、「化合物のグラフ表現ではきちんと化合物を記述することができない」ということを意味しているわけです(自明だけどね)。

なので、機械学習を利用してQM9の値を予測するってのはとても違和感がある。ただ、マテリアルインフォ系の方々と話していると「ab initioだと計算時間がかかるからコンベンショナルな計算方法があると嬉しい」っていう理由でこういう方法が望まれているようなので、そういう目的ではありかな?と思う。(適用範囲(aplicability domain)の問題とかもある半経験的な手法とどっちが良いんかな?と思わないでもないが)

でも、創薬系の活性予測とか物性予測という場面においては、量子化学計算の結果から出てくる値(energyとか双極子モーメント)とかを現状のグラフ由来のデータをつかって深層学習にかけると、なんか特徴量でてくるかもみたいな神頼みみたいな仕事はどうかと思う。そもそも潜在的に記述できてないデータをinputに突っ込んで記述できるようになったら錬金術じゃないのか?

むしろ、量子化学計算の結果として出てきたパラメータを機械学習のinputとして利用するように色々工夫したほうが良いのではないかと考えている。リガンドとタンパク質の相互作用が化学反応の一種であるならば非占有軌道を考慮できないと正確な予測はできないと思うしね。

ProductName 基礎量子化学―軌道概念で化学を考える
友田 修司
東京大学出版会 / 4536円 ( 2007-02-01 )


AIをもって鶏を割く

今日はちょっとAIに関する発表をしつつパネルディスカッションに行ってきましたが、色々面白かったので書いておく。

要するにAIっぽい仕事をしている人間を集めてショートトークさせた後、パネルディスカッションするっていう構成だったんだけど、パネラーの中で手を動かせて深層学習、機械学習をわかるのはわたし一人で、残りはネットか本かで知識吸収っていう人たちばかりだったのでパネルディスカッション正直めんどくさいなーとしか思っていなかった。あとは事前打ち合わせなしのガチンコパネルディスカッションだったのでドキドキ感はあった。

最初の質問がいきなり「AI人材を育成するには?」という直球の質問で、私が最初の回答者に指名されたので、うっかりナイーブに「機械学習とか深層学習を学んで後はドメイン知識があればいいんじゃないですかね?」というアホな回答をしてしまった。残りのパネラーもわかってない感じの返答していたけど最後のパネラーが「マインドチェンジする必要があるんじゃないかな」みたいなことを言っていて、「ほう!」となった。これはあーなるほど面白いなと。

で、次の質問が私的にはキタのだけど、それは「AIは結局のところ差別化できない方向にすすむので当社の強みにならないと思うのだけど?」という質問でこれは非常に考えさせられた(5秒位w)。で、私が答えたのは「AIは確かに普遍化して差別化ポイントにはならないでしょう、それは技術でツールだから。でもその技術を以て何を為したいのかにオリジナリティがでるのでは?」という返しが出来て、私は実は賢いんじゃないかと思いました。ついでにすかさず先の「AI人材育成質問」を引き合いに出して「うちのチームは1年半前までは深層学習とかできなかったけど、何を為したいかがはっきりしていたから短期間で成果をだして、今は全員当たり前のように毎日ディープラーニングして課題解決しています」というようなアピール出来たので良かった。でもちょっと持ち上げすぎたので、成果よろしくお願いしたい。

あと全然関係ないけど、いい研究しても伝わらないと意味がないので、伝える努力もしたほうがいいかなと思います。よっぽど発表慣れしている人でなければ資料とかポスターのver. 5までは下書きです。査読者のコメントに熟慮を重ねないといけません。学会ポスターなんて多面最適化と一緒であっちの文言帰るとこっちの文言の整合性が取れなくなるし、図をいじると他のデザインとの整合性がとれなくなるので、納得いくまでいじるもんじゃないかなーと思っていたのだけど、こっちの会社に来てみなさんサクッとドラフトっぽいものを印刷出すのでそういう文化なのかなーということで納得しようとしていたら、帰りに一緒に飲んだ同僚(今日の発表資料をさんざん直された)に「そんな文化ないっすよ!」って言われたので書いておきます。

ver. 3で諦めて印刷にまわすのはスラムダンクの三井以下やぞw

今日思いついた一番の名言やと思いましたw

それから前の会社でみんなで心がけてた標語を思い出したのでこれも書いておきます。

「理解されてアドバイスもらえるのがベスト、わかってもらうのがベター、わかった気にさせるのがマスト」

まぁそんな感じです

日本酒バー

無事に役割を果たしたので、帰りにちょっと寄った。

1541818926 1541818928

羽屋はシュワシュワしていて美味しかった。

1541818931 1541818933

今回は色々勉強になってよかったかな。

コアとコンテクスト(ノンコア)については良く考えよう

ジェフリー・ムーアのキャズムは古典だと思う。

ProductName キャズム
ジェフリー・ムーア
翔泳社 / ?円 ( 2002-01-23 )


読んでない人は一度は目を通すべきでしょう。図書館にもあるだろうし、借りて読めばOK。

コアとコンテクストはよく考えたほうがいいでしょう。何がコアなのかは自分たちがどういう強みを持ちたいのか と密接に関連するかと思います。

コンテクストをコアとみなすのは無駄な仕事が増えるだけで、結果忙しくなるだけなので別に構わないけど、コアをコンテクストとみなしてしまうのは、技術力とか強みが一気に劣化するので許容できないですね。

今年を振り返ります

今年を振り返るために、過去のエントリを眺めてみたが、ポケモンGOと食べ物関連のエントリしかなかった。この1年は家であんまりコード書けなかった感じ。職場では結構書いたけど来年はもう少し公開できるようなコードを書ければいいなと思っています。食べることに関しては引き続き美味しいものを開拓していきたい。

ポケモンGOに関しては今1000万XP弱で再開した時点で250万XPくらいだったので、どんだけやったんだ?って感じ。LV40まであと1000万XPなので週末の運動がてら継続したい。

仕事関連

今年は色々と新しい取り組みが出来て良かったと思っている。チームの皆さんに助けられて、大きな前進が幾つかあったし、自分たちのチームのプレゼンスも高められたと思っている。

色々とタイミングが良かったのだろうと思っている。そして企業のなかのチームっていうのはある意味スタートアップみたいなもんだけど、スタートアップと違うのはタイミングよりもチームのほうが重要なんじゃないかなと。良いチームだからうまくタイミングを見極められるのではないのかなーと。実際、全てそうだったしね。下のTEDはためになると思うので一度は聞いておくことをオススメします(7分弱だし)。

それから「誰をバスに乗せるか」はやっぱり重要なんだなーと感じたけど、そういうバスを用意するかというあたりも今後考えなきゃならないんだろうなぁとは感じている。

ProductName ビジョナリー・カンパニー2 飛躍の法則
ジム コリンズ
日経BP社 / ?円 ( 2014-08-29 )


他にはこのあたりを実践して、OSQAと社内twitterを導入してみたところ、色々とつながりも増えたし、よいアイデアやソリューションもシェアリング出来てよかったかなと思った。それからイントラGithubクローン便利すぎ。この1年でシステム周りが改善されて快適にコード書いたり、計算できるようになったかなと。

仕事以外のしごとっぽいこと。

mishima.sykのサイトを作った。これもコミュニティが良いから継続できてていいですね。来年も皆さんで集まれたら良いなと思います。

Bioinformatics関連

Dr. Bonoの生命科学データ解析-読書会に参加してバイオインフォ愛が戻ってきたのと、今後に関してちょっと思うところがあって、余裕があればターゲットファインディング周りも少し手を付けていきたいなぁと思った。open target platformなどのAPIついてるサービスを上手く活用できないとなーと思っている。

ただ、周りの状況を聞いていると、今の状況って僕がバイオインフォをやっていたポストゲノムって言われてた15年くらい前にやっていることと基本変わってないので(だから余裕でついていけるw)機械学習というよりはアブダクション的な手法が求められるのかなーという気はちょっとしている。最近の状況丁寧にサーベイしているわけではないから間違っているかもしれないけど、ターゲットファインディングが相変わらず難しいという状況には変わらないのかなと。

ProductName アブダクション―仮説と発見の論理
米盛 裕二
勁草書房 / 3024円 ( 2007-09-20 )


それではまた来年もよろしくお願いします。

いまさらビッグデータのこと

ビッグデータという5年ぐらい前に流行った言葉が最近この業界で流行っているので、なんだかなーと思いつつ昔買った本を読み直してみた。

ProductName ビッグデータの衝撃
城田 真琴
東洋経済新報社 / ?円 ( 2013-05-02 )


  • 3Vに照らし合わせて、ビッグデータと呼んでもいいねと思える生命科学関連データって実際どんなものがあるのだろうか?
  • データが増えることで、新たな知識の発見に繋がる可能性のあるビッグデータはどのVなのだろうか?
  • pubmedのような自然言語のデータはビッグデータと呼ぶのだろうか?

Wikipediaによると

ビッグデータ [1][2](英: big data)とは、市販されているデータベース管理ツールや従来のデータ処理アプリケーションで処理することが困難なほど巨大で複雑なデータ集合の集積物を表す用語である。

と定義されているのに、publicなデータベースをビッグデータって呼んでみたり、ビッグデータDBとか言っちゃうのはなんだかなーと思うんだよねー

言葉の乱れはサイエンスの乱れというかきちんと理解していない証拠なんだろうけど。

特に新規疾患ターゲット探索で使う手法って僕がゲノム創薬とかいう名目でバイオインフォマティクスやってた頃に比べて、すごく目新しい手法ってあんまり出てない気がするんだけどそういうわけじゃないのかな?っていうあたりが知りたいんですよね。バイオインフォマティクスとかテキストマイニングとか。

もし土曜日に会う人で、「 俺がレクチャーしちゃる 」っていう方がいたらよろしくお願いします。