今日の畑(100704)

トマトは黄色と赤いのを植えてたいたのだけど、コンスタントに採れだした。うちではハートの形のフルーツトマトが人気ですな。

1278240973 1278240998

ミョウガと甘長美人。一週間ほど放っておいたら雑草がえらいことになってたので、一時間半かけて草むしり。

1278240979 1278240986

トマトと茄子がやばいくらいとれた。あとゴーヤが採れだした。

1278240992 1278241003

ProductName 趣味の園芸 やさいの時間 2010年 07月号 [雑誌]

日本放送出版協会 / ¥ 650 ()
在庫あり。

Shiga.R

Shiga.Rお疲れ様でした。内容盛りだくさんで面白かったのと、色々な人に出会えて有意義でした。というかこの三日間は充実してた。

plotter.Rはpit使わなくても、usernameとpassword直接入力すれば動きます。twitpicのAPIを使っているので、画像をポストしつつtwitterに投稿するようになっている(デモの時にはtwitterにはポストされなかったけど)。

帰りの新幹線でRいじってたので、irisをMDSspeで次元縮約したのをポストしてた。

require("RCurl")
require("pit")
profile=pit.get("twitter.com",require=list(username="username",password="password"))

pweet <- function(status){
  tempfile <- tempfile(pattern = "file", tmpdir = tempdir())
  dev.copy(device=png,filename=tempfile)
  dev.off()
  twitpicreq <- "http://twitpic.com/api/uploadAndPost"
  params = list(media=fileUpload(filename=tempfile),username=profile$username,password=profile$password,message=status)
  twitpicresponse <- postForm(twitpicreq,.params = params)
}

あと、R版pit

R CMD INSTALL pit_0.8.tar.gz

でインストールできます。ただ、pit.setするときにエディタが起動するように鳴っているのだけど、terminalでRを起動しているときにはいいのだけど、それ以外の時(RのコマンドインターフェースとかESS)ではエディタが立ち上がらずおかしなことになるので、そこのとこをちょっとどうにかしないといけない。

あと、NAMESPACEというファイルを作ったら<<-で変数の代入が出来なくて、面倒になってファイルを削除してしまったのだけど、今日話を聞いてたらなんとなくやり方がわかったのであとでなおす。

本が届いてた

家に帰ったら頼んでた本が届いていた。

これが最近の中で一番欲しかったやつ。カラーで読みやすそう

ProductName Clinical Pharmacokinetics and Pharmacodynamics: Concepts and Applications
Malcolm Rowland,Thomas N Tozer
Lippincott Williams & Wilkins / ¥ 5,977 ()
在庫あり。

Hadoop気になるので買ってみた。

ProductName Hadoop
Tom White
オライリージャパン / ¥ 4,830 ()
在庫あり。

少し気になっていたデザインの本もこの際購入。

ProductName デザインイノベーション デザイン戦略の次の一手
ハルトムット・エスリンガー
翔泳社 / ¥ 2,310 ()
在庫あり。

予算が少し余ったのでここらも。

ProductName リバースエンジニアリング ―Pythonによるバイナリ解析技法 (Art Of Reversing)
Justin Seitz
オライリージャパン / ¥ 3,360 ()
在庫あり。

匠で日本酒

大阪でソフトウェアのユーザー会があったので、わがままをいって日本酒のあるお店に連れていってもらった。

1278076872

鶏がいい感じのお店で、焼酎の品揃えも「村尾」、「ひとりあるき」とかあってそそられた。もちろん日本酒もよさげなラインナップ

1278077039

結論:日本酒は美味い。

1278077097

そして明日はShiga.R


で、ユーザー会のほうは、IronPythonでtwitterアクセス用のdllを読みこめば、ビジュアルマイニングをリアルタイムでやりながらつぶやけるクライアントを作れそうな結論に達した。timelineを主成分分析とか共起表現探ししながらtweetできるクライアントがあれば面白いんじゃないかな。

bayonで大量の化合物クラスタリング

昨日bayonでどんだけいけるかって話になって、そういえばあんまり大きい数のクラスタリングしたことないなと思ったので早速やってみた(白macbook)。

データはPubchemから最新の25万件分(Compound_45925001_45950000からCompound_46150001_46175000まで)をダウンロードしてきた。bayon用のデータセットを作るためのpythonスクリプトは以前書いたものを使った。

for i in *.sdf.gz ; do babel -imol $i -ofpt ${i%.sdf.gz}.fpt  -xh -xfFP2; done
for i in *.fpt ; do ../python/f2bayon.py $i > ${i%.fpt}.tsv; done

とりあえず25000件くらい

$ wc Compound_45925001_45950000.tsv
   24770 6696478 20005168 Compound_45925001_45950000.tsv

$ time bayon -n 100 Compound_45925001_45950000.tsv > Compound_45925001_45950000.cls

real    0m37.312s
user    0m36.378s
sys     0m0.402s

1分かからず終了。続いて25万件くらい

$ wc all.tsv 
  248232 74728370 222905963 all.tsv

$ time bayon -n 10000 all.tsv > all.cls

real    9m49.447s
user    9m4.833s
sys     0m8.037s

これは10分かからずに終了。

Population Stochastic Modelling

違うことをしていたらPSM:PSM: Non-Linear Mixed-Effects modelling using Stochastic Differential Equationsという面白そうなパッケージを見つけたのでサンプルで遊んでみた。

PSM

集団から個人をサンプリングしてきてシミュレーションできるという理解でいいのかな?

ProductName 確率微分方程式―入門から応用まで
ベァーント エクセンダール
シュプリンガー・フェアラーク東京 / ¥ 4,935 ()
在庫あり。

スーパーマリオギャラクシー 2

スーパーマリオギャラクシー 2を購入して一週間ほど寝かせてある。

娘と一緒に楽しめるかな?

今日の某ユーザー会の感想

「スライドは全て英語にしといたほうが無難だな」と思った。日本のユーザー会といっても、日本で行われるユーザー会であって、日本語のユーザー会とは異なるのですな。でも、そのほうがいいのかも。

  • chemoinformaticsにおいてaromacityはruleにすぎない! ってのは名言だと思った。
  • javaはサポートしているからjruby使えとか、groovy使えとかScala使えというのは商用ソフトウェアのサポート体制として利にかなっているなと。
  • 同様に.NETサポートするからIronRuby使えとかIronPython使えとかF#使えとか。でもF#はあなたの趣味でしょ?と思った。

あとはAmazon EC2でガバッと計算したときにbillionオーダーの化合物の計算が安価に速く出来ればとか。そういう事例はないかなと思ったり。中小製薬企業で中途半端な数のクラスタマシンをもつより、そういう方法で計算させる方向にシフトしていけば費用対効果もいいんじゃないかなと思うんだけど、どうなんでしょうね?

cherrypyを動かすときに

例外補足しないとめんどくさい。

if __name__ == '__main__':
    from cherrypy.wsgiserver import CherryPyWSGIServer
    server = CherryPyWSGIServer(('localhost',5000), Service())
    try:
        server.start()
    except KeyboardInterrupt:
        server.stop()

Quantum Chemical Reactivity Descriptors in Computational Drug Design

ちょっと気になる本

ProductName Quantum Chemical Reactivity Descriptors in Computational Drug Design
Nazmul Islam
Lap Lambert Acad. Publ. / ¥ 5,392 ()
近日発売 予約可