10062013 家庭菜園
ズッキーニの花が咲いた。
枝豆も発芽。もう少ししたら定植する。
ジャガイモも収穫した。去年は7Kgとれたが、今年は17Kgもとれた。
陰干ししておいた。
しかし、去年よりましだけどそうか病になってた。まぁしょうがないのかなぁと思いつつ、綺麗すぎるジャガイモが常に取れるってどういうことなのかなぁと思わないわけでもない。ピクリンとかぶっこむらしい。
それからジャガイモの後作どうするか超悩んでいる。
10062013 家庭菜園
ズッキーニの花が咲いた。
枝豆も発芽。もう少ししたら定植する。
ジャガイモも収穫した。去年は7Kgとれたが、今年は17Kgもとれた。
陰干ししておいた。
しかし、去年よりましだけどそうか病になってた。まぁしょうがないのかなぁと思いつつ、綺麗すぎるジャガイモが常に取れるってどういうことなのかなぁと思わないわけでもない。ピクリンとかぶっこむらしい。
それからジャガイモの後作どうするか超悩んでいる。
09062013 drum'n'bass
リキッドな気分だったので。リキッドはつなぐのも混ぜるのも難しいので持っている割にはあまり使わないという。
Tonight / Danny Byrd Featuring Netsky Failsafe / Danny Byrd Featuring London Elektricity The Stand / High Contrast In Too Deep / Optiv & CZA Shame (Ben Westbeech) / DJ Marky & Artificial Intelligence The Plan That Cannot Fail / London Elektricity Love Has Gone / Netsky If We Ever / High Contrast Higher Ground / Young Ax Rock Baby (TC1 & Stress Level Remix) / Jagged Edge Colonel Vibenhoff / Stanza Midnight Soul / Champagne & Physics All That Jazz (Vocal) / Fresh Long Distance / DJ Marky & Makoto Everything Is Everything / Utah Jazz & Alex Reece LK / DJ Marky & XRS Sweet Harmony (Feat. Liquid) / Danny Byrd Hyper Hyper / Nu Tone Kaleidoscope (Spacejams LP) / Logistics Breathe (Hospitality - Drum & Bass 2010) / Echo Inada Rolling In The Deep (NuTone Remix) / Adele
07062013 chemoinformatics
今週、来週と発表が続いでいるのだけど、今日は(自分の中で)アツいgWTを製薬コミュニティの中で紹介してきて、そういう手法を使って何をやりたいのかっていう話をしてきたが有意義なレスポンスをいただけて非常に良かった。特にアルゴリズム系に興味あるヒトと繋がれたのと、同じような仕事のやり方をしている人とも話が出来たので、ユーザー会に出た価値があったかなと。
というより、初めて挨拶させていただいた複数の方から「ブログ見てるで」ということを言われて話を合わせやすかったので、ブログいいよなと再認識した。
それから、WizePairZの論文のAuthorにおもろかったでと言われたのだけど、そのときは著者だと認識できてなくて後からその方が発表中にAuthorだと気づいて、「おー!論文いつも楽しく読んでますよー」と念をとばしてみた(が当方変化型なので放出レベルは低いかも)。ちなみに来週はMMP絡みの話をするというか、activity cliffをプロジェクトのインシデントしてダブラズモラサズMECE精神で機械に自動的に拾わせるという話をするのだけど、また有意義な議論が出来ればいいなぁと。
06062013 life
夕方畑にいったら、畝の中ほどの土寄せが不十分でジャガイモの表皮が露出しているものを発見した。
慌てて土をかぶせてみたけど、
というあたりが気になったので調べた
1は結局わからなかったので、収穫した時にチェックする
結論: 煮る程度では分解されない
05062013 life
「なんかウェブサービスをつくりたいなと思っているが、利用規約がいまいちよくわからない」というヒトのための本ですね。
本書は「法律の条文にはこう書いてある」をスタート地点とする法律書と違い、「ウェブサービスにおいてトラベルはこういう場面で起こる」をスタート地点にしています。
05062013 chemoinformatics Python
python-pptxがテーブル対応していたので早速使ってみた。これはヤヴァイ、スクリプトで自動化したら快適になりそうな予感がする。
が、いまのとこ6行以上を指定するとファイルが出力できない模様。
from pptx import Presentation from pptx.util import Inches from pychembldb import * prs = Presentation() title_only_slidelayout = prs.slidelayouts[5] slide = prs.slides.add_slide(title_only_slidelayout) shapes = slide.shapes shapes.title.text = "10.1016/S0960-894X(01)80693-4" rows = 6 cols = 6 left = Inches(0.5) top = Inches(1.5) width = Inches(8.0) height = Inches(0.8) tbl = shapes.add_table(rows, cols, left, top, width, height) tbl.columns[0].width = Inches(2.0) tbl.cell(0, 0).text = 'inchi_key' tbl.cell(0, 1).text = 'activity' tbl.cell(0, 2).text = 'HBD' tbl.cell(0, 3).text = 'HBA' tbl.cell(0, 4).text = 'PSA' tbl.cell(0, 5).text = 'MWT' for journal in chembldb.query(Doc).filter_by(doi="10.1016/S0960-894X(01)80693-4"): for assay in journal.assays[:1]: for i, activity in enumerate(assay.activities[:5], 1): tbl.cell(i, 0).text = activity.compound.molecule.structure.standard_inchi_key tbl.cell(i, 1).text = str(activity.published_value) tbl.cell(i, 2).text = str(activity.compound.molecule.property.hbd) tbl.cell(i, 3).text = str(activity.compound.molecule.property.hba) tbl.cell(i, 4).text = str(activity.compound.molecule.property.psa) tbl.cell(i, 5).text = str(activity.compound.molecule.property.mw_freebase) prs.save('test.pptx')
というわけでSHizuoka.py #2も楽しいよと、ちょいと宣伝しておきます。
5.2のウェブアクセス数予測の節でRのコードは以下のようによくあるもの
> lm.fit <- lm(log(PageViews) ~ log(UniqueVisitors), data = top.1000.sites) > summary(lm.fit) Call: lm(formula = log(PageViews) ~ log(UniqueVisitors), data = top.1000.sites) Residuals: Min 1Q Median 3Q Max -2.1825 -0.7986 -0.0741 0.6467 5.1549 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.83441 0.75201 -3.769 0.000173 *** log(UniqueVisitors) 1.33628 0.04568 29.251 < 2e-16 *** ---
これをpandas+scikit-learnでやってみる。プロットするのでipython -pylabで起動しておく。
from sklearn import linear_model import pandas as pd import numpy as np top_1k_sites = pd.read_csv("top_1000_sites.tsv", sep="\t") scatter(np.log(top_1k_sites["PageViews"]), np.log(top_1k_sites["UniqueVisitors"])) clf = linear_model.LinearRegression() clf.fit(np.log(top_1k_sites[["UniqueVisitors"]]), np.log(top_1k_sites["PageViews"])) clf.coef_ # array([ 1.33627803]) clf.intercept_ # -2.834409473735672
個人的にRの表記の仕方(y ~ Xみたいな)のほうに慣れているのでscikit-learnのfit(X, y)という書き方は最初ちょっと戸惑った。
以下はscatter(np.log(top_1k_sites["PageViews"]), np.log(top_1k_sites["UniqueVisitors"]))で表示される散布図
03062013 life
土曜日は子供の運動会だったので日曜のみの頂参加。曇りのち雨の予報が結局晴れに変わったので、フェス日和で良かったが、日焼け止めしてても結構焼けた感がある。
頂は子供に優しいフェスなのがよかった。遊具や工作ブースがついていて子供が飽きないように配慮されているのが良かった。それから本当にゴミが少ない(これは驚きだった)
焼きごてで工作するやつ。
竹でできた巨大なブランコ(ハイジブランコ)
Photoのお店によって、オレンジジュースを調達して休憩している娘と息子。
アーティスト的にはWild Marmaladeが最高によかった。あのグルーブとディジュリドゥはヤバかった。
来年もいきたい。
03062013 life
ビッグデータとデータサイエンティストがバズっていて残念な感じに仕上がっている今日このごろですが、読み物としては面白かった(ちょっとくどいので読んでいて辛い部分が多かったけど)。
潜在顧客を探し出す手段(4つ)
目標はSMARTに。
7章の最適化の章が参考になった。A2A(分析からアクションへ)というフレームワークは興味深い(が難しい)。それは
データ->分析->テスト->共有->実行->(データに戻る)
というPDCAサイクルのようなものである。分析、テスト、共有のステージは好きなことはなんでもできるが実行ステージでの行動に変化がなければ、これまでの作業は何の意味も持たないわけであるが、行動の変化を促すのはやっぱ難しいよなぁと。特に実行者と分析者が分かれている場合はなおさらだ。
それは実行前の共有化に問題があるのかなぁと思っていて、そこら辺の改善に取り組んでいるんだけどねー。なかなか難しいですね。