今日の家庭菜園(130609)

ズッキーニの花が咲いた。

1370768248

枝豆も発芽。もう少ししたら定植する。

1370768249

ジャガイモも収穫した。去年は7Kgとれたが、今年は17Kgもとれた。

1370768251

陰干ししておいた。

1370768252

しかし、去年よりましだけどそうか病になってた。まぁしょうがないのかなぁと思いつつ、綺麗すぎるジャガイモが常に取れるってどういうことなのかなぁと思わないわけでもない。ピクリンとかぶっこむらしい。

それからジャガイモの後作どうするか超悩んでいる。

今日のドラムンベース(130609)

リキッドな気分だったので。リキッドはつなぐのも混ぜるのも難しいので持っている割にはあまり使わないという。

Tonight / Danny Byrd Featuring Netsky
Failsafe / Danny Byrd Featuring London Elektricity
The Stand / High Contrast
In Too Deep / Optiv & CZA
Shame (Ben Westbeech) / DJ Marky & Artificial Intelligence
The Plan That Cannot Fail / London Elektricity
Love Has Gone / Netsky
If We Ever / High Contrast
Higher Ground / Young Ax
Rock Baby (TC1 & Stress Level Remix) / Jagged Edge
Colonel Vibenhoff / Stanza
Midnight Soul / Champagne & Physics
All That Jazz (Vocal) / Fresh
Long Distance / DJ Marky & Makoto
Everything Is Everything / Utah Jazz & Alex Reece
LK / DJ Marky & XRS
Sweet Harmony (Feat. Liquid) / Danny Byrd
Hyper Hyper / Nu Tone
Kaleidoscope (Spacejams LP) / Logistics
Breathe (Hospitality - Drum & Bass 2010) / Echo Inada
Rolling In The Deep (NuTone Remix) / Adele

ProductName In Rotation
DJ Marky
Innerground / ?円 ( 2004-04-12 )


gWTで何をやりたいのかっていう発表をしてきた。

今週、来週と発表が続いでいるのだけど、今日は(自分の中で)アツいgWTを製薬コミュニティの中で紹介してきて、そういう手法を使って何をやりたいのかっていう話をしてきたが有意義なレスポンスをいただけて非常に良かった。特にアルゴリズム系に興味あるヒトと繋がれたのと、同じような仕事のやり方をしている人とも話が出来たので、ユーザー会に出た価値があったかなと。

というより、初めて挨拶させていただいた複数の方から「ブログ見てるで」ということを言われて話を合わせやすかったので、ブログいいよなと再認識した。

それから、WizePairZの論文のAuthorにおもろかったでと言われたのだけど、そのときは著者だと認識できてなくて後からその方が発表中にAuthorだと気づいて、「おー!論文いつも楽しく読んでますよー」と念をとばしてみた(が当方変化型なので放出レベルは低いかも)。ちなみに来週はMMP絡みの話をするというか、activity cliffをプロジェクトのインシデントしてダブラズモラサズMECE精神で機械に自動的に拾わせるという話をするのだけど、また有意義な議論が出来ればいいなぁと。

ソラニンは熱分解されるのか

夕方畑にいったら、畝の中ほどの土寄せが不十分でジャガイモの表皮が露出しているものを発見した。

慌てて土をかぶせてみたけど、

  1. リカバーできるんだろうか?
  2. ソラニンは熱分解されるのだろうか?

というあたりが気になったので調べた

1は結局わからなかったので、収穫した時にチェックする

ソラニンは熱分解されるのだろうか?

結論: 煮る程度では分解されない

ProductName ソラニン スタンダード・エディション [DVD]

TCエンタテインメント / 2780円 ( 2010-09-03 )


利用規約ガイドの本

「なんかウェブサービスをつくりたいなと思っているが、利用規約がいまいちよくわからない」というヒトのための本ですね。

本書は「法律の条文にはこう書いてある」をスタート地点とする法律書と違い、「ウェブサービスにおいてトラベルはこういう場面で起こる」をスタート地点にしています。

ProductName 良いウェブサービスを支える「利用規約」の作り方
雨宮 美季
技術評論社 / 2394円 ( 2013-03-19 )


  • 最寄りの東京地方裁判所を第一審の専属的合意管轄裁判所とする
  • 商標権検索をする
  • 利用規約の禁止事項に「当社がNGと判断した場合」は入れる
  • お金(課金)の問題は考えておく
  • 「資金決済法」

python-pptxで表をつくってみた

python-pptxがテーブル対応していたので早速使ってみた。これはヤヴァイ、スクリプトで自動化したら快適になりそうな予感がする。

が、いまのとこ6行以上を指定するとファイルが出力できない模様。

test_table

from pptx import Presentation
from pptx.util import Inches
from pychembldb import *

prs = Presentation()
title_only_slidelayout = prs.slidelayouts[5]
slide = prs.slides.add_slide(title_only_slidelayout)
shapes = slide.shapes

shapes.title.text = "10.1016/S0960-894X(01)80693-4"

rows = 6
cols = 6
left = Inches(0.5)
top = Inches(1.5)
width = Inches(8.0)
height = Inches(0.8)

tbl = shapes.add_table(rows, cols, left, top, width, height)

tbl.columns[0].width = Inches(2.0)

tbl.cell(0, 0).text = 'inchi_key'
tbl.cell(0, 1).text = 'activity'
tbl.cell(0, 2).text = 'HBD'
tbl.cell(0, 3).text = 'HBA'
tbl.cell(0, 4).text = 'PSA'
tbl.cell(0, 5).text = 'MWT'

for journal in chembldb.query(Doc).filter_by(doi="10.1016/S0960-894X(01)80693-4"):
    for assay in journal.assays[:1]:
        for i, activity in enumerate(assay.activities[:5], 1):
            tbl.cell(i, 0).text = activity.compound.molecule.structure.standard_inchi_key
            tbl.cell(i, 1).text = str(activity.published_value)
            tbl.cell(i, 2).text = str(activity.compound.molecule.property.hbd)
            tbl.cell(i, 3).text = str(activity.compound.molecule.property.hba)
            tbl.cell(i, 4).text = str(activity.compound.molecule.property.psa)
            tbl.cell(i, 5).text = str(activity.compound.molecule.property.mw_freebase)

prs.save('test.pptx')

追記 130605

というわけでSHizuoka.py #2も楽しいよと、ちょいと宣伝しておきます。

入門機械学習の線形回帰をscikit-learnでやってみる

5.2のウェブアクセス数予測の節でRのコードは以下のようによくあるもの

> lm.fit <- lm(log(PageViews) ~ log(UniqueVisitors), data = top.1000.sites)
> summary(lm.fit)

Call:
lm(formula = log(PageViews) ~ log(UniqueVisitors), data = top.1000.sites)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.1825 -0.7986 -0.0741  0.6467  5.1549

Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
(Intercept)         -2.83441    0.75201  -3.769 0.000173 ***
log(UniqueVisitors)  1.33628    0.04568  29.251  < 2e-16 ***
---

これをpandas+scikit-learnでやってみる。プロットするのでipython -pylabで起動しておく。

from sklearn import linear_model
import pandas as pd
import numpy as np
top_1k_sites = pd.read_csv("top_1000_sites.tsv", sep="\t")
scatter(np.log(top_1k_sites["PageViews"]), np.log(top_1k_sites["UniqueVisitors"]))
clf = linear_model.LinearRegression()
clf.fit(np.log(top_1k_sites[["UniqueVisitors"]]), np.log(top_1k_sites["PageViews"]))
clf.coef_        # array([ 1.33627803])
clf.intercept_ # -2.834409473735672

個人的にRの表記の仕方(y ~ Xみたいな)のほうに慣れているのでscikit-learnのfit(X, y)という書き方は最初ちょっと戸惑った。

以下はscatter(np.log(top_1k_sites["PageViews"]), np.log(top_1k_sites["UniqueVisitors"]))で表示される散布図

plot

ProductName 入門 機械学習
Drew Conway
オライリージャパン / 3360円 ( 2012-12-22 )


頂2013にいってきた

土曜日は子供の運動会だったので日曜のみの頂参加。曇りのち雨の予報が結局晴れに変わったので、フェス日和で良かったが、日焼け止めしてても結構焼けた感がある。

1370210016 1370210020

頂は子供に優しいフェスなのがよかった。遊具や工作ブースがついていて子供が飽きないように配慮されているのが良かった。それから本当にゴミが少ない(これは驚きだった)

焼きごてで工作するやつ。

1370210017 1370210019

竹でできた巨大なブランコ(ハイジブランコ)

1370210024 1370210022

Photoのお店によって、オレンジジュースを調達して休憩している娘と息子。

1370210023

アーティスト的にはWild Marmaladeが最高によかった。あのグルーブとディジュリドゥはヤバかった。

頂のよいところ

  • ゴミがない
  • 子連れに優しい

来年もいきたい。

データサイエンティストだから分析力があるのか分析力があるからデータサイエンティストになれるのか

ビッグデータとデータサイエンティストがバズっていて残念な感じに仕上がっている今日このごろですが、読み物としては面白かった(ちょっとくどいので読んでいて辛い部分が多かったけど)。

  • 分析の半分は科学で、半分はアートで出来ている

潜在顧客を探し出す手段(4つ)

  1. メディアプランニング
  2. 地理的ターゲティング
  3. 個別ターゲティング
  4. パネル

目標はSMARTに。

  • 具体的
  • 測定可能
  • 達成可能
  • 現実的
  • 時間設定

7章の最適化の章が参考になった。A2A(分析からアクションへ)というフレームワークは興味深い(が難しい)。それは

データ->分析->テスト->共有->実行->(データに戻る)

というPDCAサイクルのようなものである。分析、テスト、共有のステージは好きなことはなんでもできるが実行ステージでの行動に変化がなければ、これまでの作業は何の意味も持たないわけであるが、行動の変化を促すのはやっぱ難しいよなぁと。特に実行者と分析者が分かれている場合はなおさらだ。

それは実行前の共有化に問題があるのかなぁと思っていて、そこら辺の改善に取り組んでいるんだけどねー。なかなか難しいですね。

NASが死んだ

ちょうど一年経つかどうかというところで死んだ。昨日帰ってきたらビープ音がしてて、電源抜いて再度入れたらセミみたいな音が聞こえてきて、静かになったと思ったら青ランプ点滅したまま。

横置きにしてたから暑さにやられたのかなぁ。修理すんのもめんどいので新しいNASを買った。2Tは必要ないので1Tにした

今度は縦置きで運用してみる。