第5回入門機械学習読書会を開催しました

皆様お疲れ様でした。初めての掛川を堪能した。

ランチはとろろ汁

1377428196

御飯の量が多いが、とろろ汁美味い

1377428198 1377428199

勉強会は掛川城の中にある、いい感じの建物

1377428200

自分たちでテーブルセッティング。でもプロジェクターとスクリーン、wifi込みで1600円とはお得すぎる会場費

1377428202

おやつはあめのもちとお茶。これまた美味しかった。

1377428203

帰りに撮った城とそのミニチュア

1377428205 1377428206

懇親会は駅前の炉端焼き屋さん

1377428207

焼き鳥の肉が大きくてナイスな感じ。スペアリブが美味しかった。お酒も静岡のもので揃えてあっていい感じ。ちなみ写っているのは某合コン部長(副部長)の手。グラスに注がれているのは國香の特純

1377428209 1377428210

次回は日が空いて10/26の予定

大瀬崎でシュノーケリング

大瀬崎でシュノーケリングをしてきた。

平日なので人はまばらで快適。せっかく潜っても身体が浮いちゃうという現象に悩まされたが、なんとなくこうすればいいのかなというのを掴んだのが収穫。

あと息が持たないのが今後の課題。

1377260552 1377260553

ソラスズメダイとルリスズメダイ。色々癒されてきた。

1377260555

魚の名前を覚えようと思った。ついでにカメラも欲しくなった

井田海水浴場でシュノーケリング

今週は色々バタバタしてたので、8/10に気晴らしも兼ねてシュノーケリングしてきた(2度目)。今日は北側オンリーで。

1376159227

息が続かないので息を止め続けるトレーニングをするといいらしい。というわけで、会議の時つまらない発言が出だしたら息を止めてみることにした。まぁ、放置部署なので会議ないんだけど。

耳抜きがうまくいかないので、数をこなしたい。

あと、フィンは長いほうがいいのかなぁと思ったんだけど、そもそもフィンワークがダメな気がしているので精進する。

目撃したサカナ

  • うつぼ
  • イカ
  • キンギョ(ネンブツダイ)
  • チョウチョウウオ
  • ベラ
  • あと色々

釣りしているとキンギョは邪魔だけど、群れで泳いでいる姿は綺麗なので、邪険に扱うのはやめようかと思った。

イカの群れって横並びなのね、見れてよかった。

飽きもせずに浮かんだり潜ったりしてた。終了近くまで井田に居た。

1376159219

帰りの夕日が綺麗だった。

1376159229

超楽しかった。

今週末は第5回入門機械学習読書会です

ランチに名物のいも汁を食すかたは掛川駅に1130に集合です。

ProductName 入門 機械学習
Drew Conway
オライリージャパン / 3360円 ( 2012-12-22 )


一応6回で終了すると思うので次回以降の読書会のネタに関しても話し合いたいので、なにか推薦する方は教えて下さい。

いまのところ、機械学習の延長線上にありそうな「実践コンピュータビジョン」はどうかなという話が上がっております。OpenCV+機械学習+Pythonという結構面白い本だと思います

ProductName 実践 コンピュータビジョン
Jan Erik Solem
オライリージャパン / 3150円 ( 2013-03-23 )


帰省していた

栃木の北の方に帰省してきた

初日

尚仁沢のある山に行ってきた。湧水公園メンテしてない感がありありでどうしようもなかった。水汚なすぎて水遊びする気が起きなかった。

こっちはトンボが飛びまくっていて秋だった。

1376867270

山の上にあるカフェで。

1376867272 1376867273

帰り道に、鳳凰美田でも買うかなと立ち寄った酒屋が休みで、別の酒屋で代わりの酒を物色。

1376867274 1376867276

東力士の微発泡酒が美味しくて四合開けた。さらに、浦霞もちょっと開けた。

1376867277

布団で横になったら、子供より先にそのまま就寝

二日目

朝の散歩は田んぼを攻めてみた。すぐにビシャビシャになったワンコ

1376867279 1376867280

栗の木、今年の出来はいいらしい。新幹線が近くで見えるので息子を連れて行ってやろうと思ったけど。

1376867281 1376867283

写真をとって見せたら、それで満足したらしい。ついでに野生の栗が生えてた。

1376867284 1376867286

またまた、あぜ道を通って帰る。小川にドジョウとかいそうなんだけど汚れるのが嫌だったのでスルー。

1376867287 1376867288

白百合のはなが咲いていた。こっちのほうではよくみる花だけど。

1376867290

昼は中川水遊園で水遊びをして、また酒を買ってきた。いろはビールは普通の味。天鷹スパークリングも辛口の日本酒に炭酸のっけた感じで、前日の東力士のほうが好みだった。というわけで小瓶にしておいてよかった。

1376867291 1376867293

夜は花火にお付き合い

1376867294 1376867296

月が綺麗

1376867297

三日目

夜明け前からワンコが吠えるので外に連れだした。結局1時間半くらいひきまわしたので最後ばててたw

小学校跡。全校あわせて200人いなかったので小さい(というか田舎)。

1376867298 1376867300

さらにずっと歩いて川まで。サワガニとったり鯉釣りしてたけど、河川工事してコンクリで埋めたのでカニはいなくなったみたい。眺めてたらサカナが跳ねた。

1376867301 1376867302

昼はファミリー向け遊園地で。炎天下のアトラクション辛い。

1376867304 1376867305

帰りに、氏家駅前の酒屋さんで。鳳凰美田のワイン酵母の日本酒と、おりがらみスパークリング。それから仙禽の純吟を購入。ちなみに仙禽酒造はこの近所ですね(いったことない)。というより酒造めぐりってしたことないや。

1376867307

この日も月が出ていた。

1376867309

鳳凰美田のワイン酵母のほうを開けた。室温に戻るに従い味がふくらんできて気持ちいい。

1376867312 1376867314

twitterのリプライ頻度を可視化する

python+pandasで全部やればいいんだけど、ggplotが使いたかったので。

とりあえず全件取ってきた状態で

import csv

tweets = csv.reader(open("tweets.csv"))

print "Date\tMessage"
for tweet in tweets:
    if "[[user_id]]" in tweet[7]:
        print "{}\t{}".format(tweet[5].split()[0], tweet[7])

これである程度綺麗になったtsvが出力されるのであとはRStudioでいじる。data.tsvっていう名前で保存した。

library(plyr)
library(ggplot2)
library(scales)
setwd("/Users//kzfm/lang/rcode/tw")
tweets <- read.delim("data.tsv", sep="\t", stringsAsFactors=FALSE, header=TRUE)
tweet.counts <- ddply(tweets, .(Date), nrow)
date.range <- seq.Date(from=as.Date("2012-10-20"), to=as.Date("2013-8-12"), by="day")
date.strings <- strftime(date.range, "%Y-%m-%d")
dates <- data.frame(date.strings)
all.data <- merge(dates, tweet.counts, by.x=c("date.strings"), by.y=c("Date"), all=TRUE)
names(all.data) <- c("Date", "Counts")
all.data$Counts[is.na(all.data$Counts)] <- 0
all.data$Date <- as.Date(all.data$Date)

ggplot(all.data, aes(x=Date, y=Counts)) + 
geom_line() + 
scale_x_date(breaks="2 week", labels=date_format("%Y-%m-%d")) +
theme(axis.text.x=element_text(angle=-90))

入門機械学習の1章のやりかたが参考になった。

ProductName 入門 機械学習
Drew Conway
オライリージャパン / 3360円 ( 2012-12-22 )


入門機械学習の9章を読んだ(Multi Dimensional Scaling)

8/24の入門機械学習読書会の範囲になっているMulti Dimensional Scaling(MDS)の章を読んだ。

ProductName 入門 機械学習
Drew Conway
オライリージャパン / 3360円 ( 2012-12-22 )


最初から距離しか与えられてない場合にはMDSだろうけど、普通はPCAでいいんじゃないかなーと思いつつ。あとユークリッド距離使うんだったらSPEでもよかろうと。

ちなみにクラスタリング関係をRでやるんだったらこの本が参考になるんではないかと。バイオインフォと書いてあるけど、あれも結局インフォマティクスなんで、バイオロジーの知識がなくてもアルゴリズムとかクラスタリングの使い分けとかは理解できると思います。というわけで欲しいかたがいれば持っていきますので、連絡ください。

尚、次回の入門機械学習読書会は掛川開催でランチに名物のいも汁を食べに行くので興味ある方は参加されると良いです。本の内容は8,9,10のPCA,MDS,K-meansといったクラスタリング関係をまとめてやります。

最近飲んだ日本酒(130812)

コメヤスさんで買ったBlack Phoenix。いつもの鳳凰美田に比べると酸が強めかな、なんかそんな感じ。

ちなみに最近は持ち歩きが苦にならない4合瓶の割合が増えている(あちこちで買うので)

1376248945

黒地に金字ばかりを飲んでいた。

1376248947

いけたにさんで購入した、小鼓の純米吟醸

1376248948

親戚から送られてきた大信州の夏酒。小鼓と大信州はなかなか綺麗目

1376248950

白瀑の純米大吟醸と金字の山本は大体同じ値段なので、こっちも買ってみたけど。

1376248952

開運のあさば一万石は酸がきつく感じた。涼々のほうが好み

1376248954

創薬はプロダクトバックログという考え方が弱いかな

知財化する際に、誰が作ったかが重視される風潮がある気がするので仕方ないのかなと思う部分を差し引いても、合成案とケミストの癒着は強いんじゃないかなぁと。

スクラムにおけるプロダクトバックログとかスプリントバックログ的な考え方をもっと強く押し出さないと、プロジェクトに貢献できないんじゃないかなぁ。

あと、合成案批判を人格批判と受け取るヒトが多すぎる気もする(文化かな)。それも知財化が絡んでいるんだろうな。

とか考えていたら、ペアプロみたいに合成案を相互レビューするようなやり方ってメリットあるんじゃないかなぁという気がしてきたけどどうなんだろうね。

GitHubなんかを使い続けてソースコードの共有が普通に受け入れられるようになると、創薬のプロジェクトで、自分の案に固執したり、クローズにしたがるカルチャーに閉塞感を感じてしまう。