IBIS2010に行ったら、LSHくらいは押さえておかないといけない雰囲気だったので、今日はずっとLSH関係を調べていた。
解説
- Locality Sensitive Hashing
- LSH Algorithm and Implementation
- Learning to Hash! 最新 Locality sensitive hashing 事情
- LSHまとめ(1)
実装
とりあえずコードを読むと数式の意味がわかることが多い。
この本どうやろか?
IBIS2010に行ったら、LSHくらいは押さえておかないといけない雰囲気だったので、今日はずっとLSH関係を調べていた。
とりあえずコードを読むと数式の意味がわかることが多い。
この本どうやろか?
05112010 work
仕事で使うかどうかわからんけど、欲しい
「ボーナスでたらまとめて買う本」のリストにいれとこ。
31102010 work
ユーザー会お疲れ様でした。私の同僚の内容の思想的な部分はRESTful Webサービスのリソース指向アーキテクチャの章を読めばいいかなと。
いまだとJSON返してjQueryとかで組み立てるような仕組みを採用するかなぁ。iPad対応とか(無駄に)してみたいし。
さて、自分の内容で「ハイパーグラフは使わんのか?」という質問があったのだが、ピンとこなかったので、帰ってきてから調べてみた。
グラフとは異なり、ハイパーグラフは紙上に図示するのが困難である。そのため、グラフ理論のような図解をされることは少なく、集合論の用語で表される傾向がある。
ハイパーグラフは他の数理科学分野では別の名前で知られていることも多い。たとえば協力ゲーム理論で「シンプルゲーム」(投票ゲーム) とよばれる概念がそれに該当し、社会選択理論の重要な問題を解くために応用されている。
あーこれだと複数のグラフをまとめて扱えますね。でも、薬理活性、ADME,in silicoのネットワークから、共通部分グラフを取り出したいだけだったら、別にHypergraphを使う必要ないからなぁ。実際に具体的な事例があるともうちょい理解度深まるかな。
24102010 work
手放しで大絶賛する内容かと言われると疑問符が付くが、第三部の内容が言語化されていることが素晴らしい。第一部と第二部は今時の常識で、それを知らないヒトのために丁寧にベージを割いているといった感じ。でも、ラテラルシンキングは改めて読むといいことがたくさん書いてある。
特に
想像力だけで勝負できる場所などどこにも存在しないのであって、地道に積み上げたスキルの上に、そのスキルの文脈の範囲内においてのみ花咲くのが価値ある創造性
は、僕が普段「下からは見下ろせないよ」と表現するような感覚、つまりサイエンティフィックにより高いとこに登ってみて初めて見えてくる創造性の世界を言い表していて気に入った。結局、自分の能力の範囲を超えたセレンディピティなんか存在しないし、してはいけない(と強く思う)。
三部は、これからの思考というタイトルに関することなので垂直、水平思考を知っているヒトが読めばかなり面白いと思う。ただ、学びの場を企業内においているけど、実際は企業内で学ぶことよりも、それを離れた場所での学びの比重が増えてるからそういった部分は何かで補う必要があるかもしれない。
例えば、「ウェブで学ぶ」とか。
17102010 work
創薬研究というのは細かな作業が沢山あり、変化の激しいテスト工程なのに、そのインフラにはBTSとかITSとかないのが不自然だと思っていて、この前寄稿したときにちと触れといた。僕はソフトウェア業界にいるわけじゃないけど、問題解決の方法論としては似たような部分があるから参考になるんじゃないかと常々思っていたら、ズバリな本が出ることを知ってすぐに予約しといた。
で、一昨日届いたので今日の移動時に一気に読んだ。
チケット駆動開発的なアプローチは自分の仕事管理では既に取り入れていたのであった。自分では文書駆動開発だと思っていたけど本書を読んだら、これは明らかにチケット駆動開発のコンテクストだよなと。
個人的には第一部の技法は非常に勉強になった。第二部は実際にRedmineをどう使うかという話はソフトウェア開発としては色々面白かったが、自分ではRedmine使ったことがないので、ピンと来ない話も幾つかあった。実際に使って見ながら本書を読み直せば新たな発見があるのだろうと思うので、今度、創薬のプロジェクトで、Redmine使えないか検討してみようっと。そうすれば創薬向けのITSとかBTSみたいなものがみえてくるような気がするんだよな。アジャイル創薬とかそういう方法論は一部試され始めているのでその先はこういうツールの重要性が認識されるだろうと思うんだよね。
それにしても、「ツールでサポートすれば行動が変わる。行動が変われば考え方が変わる」というのはいい言葉ですな。うちのインフラやってるチームにも本書を薦めてみようっと。
以下、メモ。
12102010 chemoinformatics work Python Mercurial Sphinx
SAR News No19に寄稿しました。この号はSVM,RFとかの統計手法を使ったSARから可視化とかグラフっぽい処理とか、ToolKitを使ったプログラミングとか、日本ではあまり見かけない内容なので面白いのではないでしょうか?
余談ですがハッカソンっぽい場もあるので、ちと書いてみるか(または飲んでみるか)という方がいれば連絡を下さい(まだ空きあります)。僕はOpenBabelを使ってGAMESSの量子化学計算で構造最適化をするラッパーを書く予定にしています。それかHaskellのchemoinformaticsライブラリのソース読んでます。
さて、今回の原稿を書くのにSphinxを使った。これ最高ですな、EPubも出力できるし、超便利。ただ、今回は原稿の提出がwordだったのでwordの行間調整したりとかよくわからない部分で難儀したけど(word嫌い)。でも履歴管理の仕組み(変更モードって言うの?)はメールでやり取りするときに便利だったけど。
あとバージョン管理はMercurialを使った。Gitに比べてwebアクセスが簡単に設定できたのでチョイス、あと文書管理だとそんなに複雑な操作しないし。
08102010 work
写経無しの流し読み。論理プログラミングっぽいとこはOn LispでやったかPrologの本読んだか、なんとなく追うだけで理解できたので。
ネットで得た情報を一度自分の中で整理するという目的においては本書は良かった。
03092010 work
なんとなく思ったので、書いておく。
PDCAサイクルってありますね。Plan - Do - Check - Actionというあれです。
創薬もアジャイル開発なのでPDCAをどんだけ早く快適にまわすかってのは重要なわけです。
創薬的にはこんな感じ
個人的には量子化学的な手法をSBDDに組み込むっていうのが興味があって色々やっているわけですが、ああいう手法って解析の部分には非常に貢献する(見えなかった相互作用が明確に理解できたりとか)のだけど、じゃぁ、その知見を「合成計画に反映させる」となると、とたんに難しくなったりして、結局、解釈で終わってしまうことが多々あるわけです。
僕自身は、そういうことを積み重ねていって段々とPlanのほうにも貢献していくようにノロマなプロセスを踏むしかない(というか踏む)のがいいのかなと思っているのだけど、成果主義的な観点だと「結果的に貢献してないから何もしてないと同義」的な扱われ方をしますよね。
と、よくある成果主義批判っぽいことを書いているだけなんですけど、それがダメっていいたいわけじゃなくて、そこんとこをうまくバランスとっていく術ってないのかなぁと。
そういう例が知りたい。
ブックオフにて。アマゾンの星の多さの割になんというか同意できない内容が多くて、そういう主張を読むという意味ではなかなか興味深かった。労働者は会社に搾取されているっていう前提で、幸せに生きる権利を獲得しなければみたいなスタンスかな。本書からは社員がなんかの目的のために集まって結果できた法人形態が会社っていう立ち位置はさらさら感じさせない。
もちろん正規、非正規にも触れていていて雇用の流動化は悪っていう主張っぽい。
あと、紙切れが挟まってた。栞として便利だったのでそのまま挟んで使った。

ということは著者は社民よりってこと?それとも共産かな、わからん。
理想はまぁその通りだと思うんだけど、それを達成しようとする手段に組合臭を強く感じた。
モチベーション3.0とかハイコンセプトが、自分で未来を切り開こう的な前向きな内容なのに対して、本書は、企業に奪われた「幸せという宝箱」を奪還しようというRPG的な内容かなぁ。まぁ、宝箱の中には「安定雇用」も「正規雇用」も入ってなくてスッカラカンだとおもうんだけどねぇ。