10122015 life
出来に納得出来ないが、消費速度は早いw
ラム酒漬けというかラム酒はワンコのお気に入りw
10122015 life
出来に納得出来ないが、消費速度は早いw
ラム酒漬けというかラム酒はワンコのお気に入りw
08122015 life
ハンドブレンダーを購入してから、やたらとかき回している(定番のバナナから、こしあん、里芋のポタージュまで)
先週末はほうれん草をグリグリやってやった。
ほうれん草を二束茹でたら
グリグリやります
あとは、玉ねぎとトマト水煮とヨーグルトに漬けておいたチキンを煮込んだら、先ほどのほうれん草ペーストを混ぜあわせて更にちょっと煮るだけ。
完成品は撮ってないw
05122015 chemoinformatics deeplearning
深層学習が届いていたので読んでいました。
対象読者としては、レビューにもあるように
ただどちらも内容の難易度は少し高めで、またビジネスへの応用が書いてあるわけでもないので 「ディープラーニングって最近よく聞くけど何がすごいの?」 というような疑問を持つ一般人や分野外の人には向いてないだろう。 あくまでこの分野を研究している人向けの本である。
だと思う。少なくともPRMLは読んでいないとしんどいと思うのだけど、読むと確実に広がるのでこの際ついでに読みましょう☆
僕自身は分野外ではあるのだけど、タイトルにもあるようにChemoinformaticsへ適用できるかなぁっていうことで興味を持っているので、一部の基礎編と二部の応用編の画像認識、自然言語処理の章が参考になった。
高速文字列解析の時もそうだけど、結局化学構造は文字列表現とかグラフ表現するので、シニフィエ、シニフィアン的な側面があって、こっちの学問も必然的に追いかけないとトレンドキャッチアップできないよねと。しているヒトがあんまりいないけど。
本書を読んでいて、なんとなく自然言語処理で使われているような方法論を取り入れてみればいいのかなぁと思ったけど、ECFP(FCFP)って結局bi-gram,tri-gramみたいなもんだし、自然言語には文法という並びに意味があるけど、化合物の文字列表現の場合は方向がそろっているわけではないからその辺りをどうにかしないと難しいよねと改めて思ったのと。
現状の化合物の表記法が、例えば軌道とかを暗(implicit)に記述できているのかなぁというあたりがちょっと疑問。
そういった点も含めてKaggleのあれに関しては別のエントリでちょっとメモった。
それから、もし資料が作れればMishima.sykで話すかもしれません。
05122015 chemoinformatics deeplearning
丁度2年くらい無気力が続いていたので今更感があるがMerck Molecular Activity ChallengeについてChemoinformaticsの実務者側からのメッセージ的なものが無いので書いておいてもいいかなと。
一応ググるとDeepLearningが活性予測に超使える的な文脈で語られているが、実際はこの結果を受けて「すげー使える」という印象をもっているChemoinformatistはほとんどいないはずです。二位のチームがSVMを使っているのだけど、精度がほとんど変わらないので、 「あーSVMでいいじゃん」 という印象のほうが自然かと(評価方法はこれ)。こっちも参考に。
特徴量作りに心血を注いできたデータサイエンティスト憤死
とあるけど、実際はモンストでいうところの 「ミリ残しでギリ勝ちしたわ」 であろうと。
むしろ個人的には、スコアが(例えば画像認識に比べて)非常に低いというところを熟慮しないといけないと考えている。
Feature Engineering,特徴量づくりをほぼやらず,必要最低限の前処理しかしてない
と話しており
じゃぁ、仮に 特徴量の学習をさせたら大幅に精度が向上するのか?
というあたりが非常に気になるわけです。
実際、トレーニングセットを見てみると、記述子よくわからなかったw やたらスパースだし、フィンガープリントじゃなくIntegerだったのでなんかの特徴をカウントしてんのかな?
正直これから特徴量作れないんじゃないかなぁと。既に記述子の段階で必要な情報が落ちているんじゃないかとしか思えなかった。
我々 Deep Learning 屋は特徴量を工夫するよりも,特徴量を可能な限りデータから学習していたい.こういう傾向って Kaggle にいる特徴量作りに長けた人々を相手にした時に不利になるかもしれないけど,今回は上手くいったわ.
というように特徴量を学習できるようなデータはどういうものか?というあたりを真剣に考えないとダメなのではないかなぁと思っているわけです(少なくとも現在使われているフィンガープリントでは難しいでしょう)。
それがどういうものかなぁというあたりを考えていきたいところです。
05122015 d3.js
このブログは12年以上続けているのだけど、ここ2年程モチベーションが下がりまくっていたので、エントリ数をバーチャートにしてみた。
本当は左側に年を付けたかったのだけどtwitter-bootstrapが悪さしているみたいで、おかしなレイアウトになってしまうので諦めた。
来年はコード書いたり色々したい。
D3.js楽しいですね。
02122015 d3.js
30112015 d3.js
これはわかりやすい
これどういう本だったか忘れたw(昔読んだのに)
30112015 life
懇親会は今週末で締め切るので参加を悩んでいる方はお早めに。
29112015 life
いつも行っている魚屋さんに寄ったら、ズガニが入荷していたので買ってみた。
魚屋さん情報だと、
との事だったけど、ごく弱火で茹でてみた結果すべて足が外れなかったのでOK
ズガニはこんな感じで結構でかいです。(娘の手)
鍋に入れた時と茹で上がり。綺麗な赤になるので織部のお皿に盛り付けると映えますね(写真は織部ではない、ただの安物w)
茹で汁はご飯を炊く時につかってみたらいい感じの味わいになった。
味噌汁にも使ってみたんだけど、茹でるときに塩をかなり入れたせいで味噌汁自体がしょっぱくてあまり美味しくなかった。検討の余地ありですな。
そろそろ旬もすぎるだろうから来年リベンジかな… 来週も入荷していれば買ってしまうかもしれないくらい美味しかった。コスパもいいだろう(上海蟹買うことを考えたら…)
色々理由はあるんだけどここ二年くらいコード書く気が起こらなかった。
まぁそのうちの理由の一つは、こんな感じで手持ちのMBAのディスクが常にフルを張り付いていたというのがある。常に容量を気にしながら新しいライブラリを導入したり、ソフトウェアの更新したりするのは萎えるし、MP3を気軽に買えないっていうのも辛い(そのタイミングでD'n'B Arenaの購買サイトが閉じたのも結構な打撃だったし)。
$ df
Filesystem 512-blocks Used Available Capacity iused ifree %iused Mounted on
/dev/disk0s2 488555536 467626280 20417256 96% 58517283 2552157 96% /
devfs 375 375 0 100% 650 0 100% /dev
map -hosts 0 0 0 100% 0 0 100% /net
map auto_home 0 0 0 100% 0 0 100% /home
流石に今年の冬は新しいノートを新調しないとと思っていたので、新しいの買うかなーと思っていたけど、深層学習で遊びたいしなーとGPUつき見てみたら余裕の20万超えで躊躇してしまった。ちょっと深層学習はやりたいけど、ちょっと遊ぶだけだったらAWSでもいいかなと思っている。
そしてそんな折、換装できることを教えてもらったので早速ポチった。
換装後
$ df
Filesystem 512-blocks Used Available Capacity iused ifree %iused Mounted on
/dev/disk0s2 936023872 466405656 469106216 50% 58364705 58638277 50% /
devfs 366 366 0 100% 634 0 100% /dev
map -hosts 0 0 0 100% 0 0 100% /net
map auto_home 0 0 0 100% 0 0 100% /home
やばい、快適すぎる。
早速Haskell Platformの最新版入れた☆
楽しい☆