feedparserとfeedgeneratorを使ってRSSを加工する

職場でオープンソース版「Fastladder」を入れて使っている。

最近、最も保守的だと言われている知財の部署からエラー報告や、要望とかがちょくちょく寄せられるようになってきて、おー結構普及したなぁと延べ人数数えたら7割超えてた。Fastladderの前に一年くらい違うRSSリーダー使ってから3年半くらいかかってここまで来た感じ(RSSごときで3年もかかんのか?なんて思うんだけど、一般的に製薬業界はITリテラシー低いですね。なんでだろうかね?)。

地道な啓蒙活動に付き合って講習会を手伝ってくれたK君とかN君とか、別のサイトで普及活動に励んでくれたA君に感謝しないとな。

さて、登録されてるフィードの内容見てるとPubmedWIPOのPatentscopeが多いが、知財のヒトからエラー報告として挙げられた内容の中に400件くらいエントリのあるフィード(WIPO)を新規登録できないってのがあった。

研究者はプロジェクトの内容で検索かけるのだけど、知財のヒトは会社毎の検索式を追いかけたりするらしい。例えばPA/TAKEDA PHARMACEUTICALなんて検索かけると700件以上ヒットして、その検索式をRSSにすると500件のエントリが含まれるRSSが出力される。これがfastladderだと新規登録で弾かれる。ちなみに研究者の検索する状況ではそんな多量のエントリーの含まれるフィードは出てこなかったりするので今まで問題にならなかったみたい。

ソース見てないからわかんないんだけど、fastladderの未読記事のmax200件にしてるからそれで引っかかってんのかなぁと

んだよWIPOのRSSはmax指定できないの?->できないっぽい

とりあえず、feedのエントリ数を減らすような中継かませばいいんじゃないかと、休日を利用してササッと書いてみた。

import feedparser
import feedgenerator
from time import mktime
from datetime import datetime

MAX_ENTRIES = 10
wipo_url = "http://www.wipo.int/pctdb/en/rss.jsp?C=1&QUERY="
query    = "(FP%2FPA%2FTAKEDA+AND+FP%2FPHARMACEUTICAL)"

d = feedparser.parse(wipo_url+query)

feed = feedgenerator.Rss201rev2Feed(
    title       = d.feed.title,
    link        = d.feed.link,
    feed_url    = d.url,
    description = d.channel.description
    )

for entry in d.entries[:MAX_ENTRIES]:
    feed.add_item(
        title       = entry.title,
        link        = entry.link,
        description = entry.description,
        pubdate     = datetime.fromtimestamp(mktime(entry.updated_parsed))
        )

print feed.writeString('utf-8')

あとは、CGIかFlaskで動かせばOKでしょう。

pubdateのとこで若干はまったけどsofのパワーで解決。

今は、イントラQAサイトを定着させるのにちょっと力を入れてる。

勉強会などのイベントに本の交換機能もつけるといいのではないかと思った

読み終わった本の処分に困っているが、ブックオフだと買い叩かれてなんか勿体無い上にあんま社会貢献してる気にならんし、かといって本の交換サービスは必要とされているヒトに届いてる感はあるけど、梱包したり宛先書いたりするのが面倒だ。

ふと、

技術系の勉強会に持って行って交換すれば、必要とされるヒトに届けるという満足感が得られる上に、郵送するっていう煩わしさもなくなるんじゃないか?そもそも勉強会の度にmacbookとか色々重い物持ち歩いて移動してんだから本の4冊や5冊たいした負担じゃないでしょ。

と思ったので、とりあえず自分の交換してもいい本のリストが出るようにしてみた。

「コレ欲しい」ってリンクをクリックすると僕宛にtweetされるようになっていますので、なんか欲しい本があったらお気軽に問い合せてください。勉強会とかで会えれば持って行きます。

なんとなく考えたこと

書籍交換サービス『Bibuly』の不安要素 / 三十両

  • 古本屋に安く買い叩かれるのはすっきりしない
  • ネットオークションは出品の手間が面倒
  • 本当に必要な人に受け取ってほしい

これはその通りで、さらに

逆にそういう人は、こういうサービスじゃなくて、自分の身近な人とのコネクションを使って本をさばこうとするでしょう。例えば、同じ趣味を共有している友人だったり、同僚だったり。

なので、適当な本棚サービスとtwitterと身近なコネクションを結びつけて、ゆるい交換の基盤を用意すればいいかなと思った。

その他

ProductName シェア <共有>からビジネスを生みだす新戦略
レイチェル・ボッツマン
日本放送出版協会 / 1995円 ( 2010-12-16 )


シェアも色々面白いこと書いてある。

参考にした技術

javascript楽しいですな

ブクログはスマートフォン使って本のバーコードから登録作業が出来るので楽ちん。あと ATNDのAPIを使ってマッチングできるようにしておけばいいんだけど、近々参加する予定の勉強会はいずれもATND使ってないんだよな。

ユーザー登録はtwitterのOAuthでいいんだけど、とりあえず自分だけ。

「現場でプロが培った Google Analyticsの使い方」を読んだ

Google Analyticsを使ったアクセス解析 == 因数分解

Google Analyticsって面白いね。単にアクセスログを見て視覚化して増えた減ったを単純に喜ぶくらいなんかなぁと思っていたけど、実際に本書を読んだら、推論して仮説を立てて検証していくプロセスを実行出来るところが気に入った。

Hello? / Jostein Gaarderに超気に入っている一文があって、それは

'An answer is always the stretch of road that's behind you. Only a question can point the way forward.'

仮説の設定力が重要なのね。というわけで、本書にはそのためのヒントが幾つか散らばっていた。でも、僕はそういうことを検討するためのサイトを持っていないので欲しい、というかなんかつくろう。

ProductName 現場でプロが培った Google Analyticsの使い方 (WEB PROFESSIONAL)
中野 克平
アスキー・メディアワークス / 2079円 ( 2010-02-12 )


  • コンバージョン率の測定はPDCAのC
  • ソーシャルトラフィック
  • 時間帯別の指標からユーザー属性を読み取る
  • 成否の指標を明確にしよう
  • 検索エンジン(yahoo,google)
  • 一本化されたからこれは今後あまり問題にならない?
  • Webプレゼンスをキーワードから判断していく
  • ユーザーの目的はコンテンツを実際に目にすることで変わる
  • アドバンスセグメントで指標を深く読み取る
  • トラフィックの割合の変化はあまり意味が無い

あと、これってSpotfire向きの仕事だよね。だれかそういう使い方してるヒトいるのかなぁ。今度聞いてみよう

KKD(勘・経験・度胸)

KKDは特に否定しないし、それなりに重要だと思っている。ただ、職場内で共有できない情報とかスキルであるという点は問題だと思っているけど。

よくよく考えてみるに、KKDはアブダクションと密接に関連するのかな?またはセレンディピティ的な嗅覚みたいなものを表す言葉なんだろうなぁと漠然と思っている。そういう意味でイノベーション的には非常に重要なフォースとして働くなにかなんだろうと。

ただそういう能力は、深い洞察力とか論理的な思考力を背景としたものであり、宝くじに当たるかもという期待感をKKDとか言ってしまうのとは違うんじゃないかなぁと思うのであった。

ProductName アブダクション―仮説と発見の論理
米盛 裕二
勁草書房 / 2940円 ( 2007-09-20 )


「イシューからはじめよ」を読んだ

今年読んだビジネス系の本の中ではピカイチだった

限られた時間の中でいかに本当のバリューのあるアウトプットを効率的に生み出すかというゲーム

イシューを見極めるとあるが、逆に見極められないというのは何が問題か理解してないで、問題を解こうとする状態なのであろう。本書では「何に答えを出す必要があるのか」という議論からはじめて「そのためには何を明らかにする必要があるのか」という流れで分析を設計していく必要性を説いている。

また、イシューが特定できないときのアプローチを提案している。

よいイシューの3条件は「本質的な選択肢」「深い仮説」「答えを出せる」とあるが、自分の関わっている研究系の業務だと、分析に答えを出せるが、そこからどう方向付けしていいかの技術的な課題が結構あって苦労することが多いかな。あと、本書で触れてるFishing Expedition(肯定的な結果が出ないと役に立たない実験とか合成)をするヒトは結構多くて、「結局、最後に結果がでてればいいんでしょ」とか言われるんだけど、少しづつ変えていく必要はあるよなぁと思った。

ProductName イシューからはじめよ―知的生産の「シンプルな本質」
安宅和人
英治出版 / 1890円 ( 2010-11-24 )


  • 「考える」と「悩む」の二つの違いはなにか?
  • 犬の道とは
  • 犬の道を通ってリーダーになれたとしても、部下に犬の道しか示すことができない
  • 根性に逃げない
  • 一次情報を死守せよ
  • whyではなくwhere,what,howのイシューの表現を
  • よいイシューの3条件は「本質的な選択肢」「深い仮説」「答えを出せる」
  • 「答えのだせないもの」はよいイシューとは言えない
  • ワンウィークアンサー
  • イシューの分解
  • 何がわかればこの意思決定ができるかという視点
  • 空、雨、傘
  • 「どんなデータが取れそうか」ではなく「どんな分析結果が欲しいのか」
  • 分析とは比較、すなわち比べること
  • 限られた時間の中でいかに本当のバリューのあるアウトプットを効率的に生み出すかというゲーム
  • Fishing Expedition
  • プロジェクト終了のイメージ

2010年に読んだ本

今年読んで良かった本をビジネス系と技術系で5つずつあげてみる。

ビジネス本は読んだ量の割に心に残るものは少なかったけど内容がいい本は深くて色々考えさせられた。特に「イシューからはじめよ」はピカイチだった。

技術書は前半はPK-PDの本とか読んでいて、後半はプログラミング関係をそこそこ読んだ。Ruby関連の本が面白かったような気がする。エキスパートPythonプログラミングも大きい。

ビジネス本

とんがり

ProductName 小さなチーム、大きな仕事―37シグナルズ成功の法則 (ハヤカワ新書juice)
ジェイソン・フリード
早川書房 / ?円 ( 2010-02-25 )


ログをとるのは楽しい

IT業界に限らず、変化が激しい業界では短期的な成果を出すことも、長期的な視野での成果(つまり自分の成長)もきちんと考えることが大切だと思う。

自分で自分を経営しているって感覚が当たり前になるんだろうなと思っている

ProductName 経営の教科書―社長が押さえておくべき30の基礎科目
新 将命
ダイヤモンド社 / 1680円 ( 2009-12-11 )


昨日読み終わったので感想記事を書いてないが、すごく良かった。ピンと来る人にはグイグイ引き込まれる内容。

ProductName イシューからはじめよ―知的生産の「シンプルな本質」
安宅和人
英治出版 / 1890円 ( 2010-11-24 )


技術書

5章まで残り。何度か読みなおしてPythonへの理解を深めていくための本

ProductName エキスパートPythonプログラミング
Tarek Ziade
アスキー・メディアワークス / 3780円 ( 2010-05-28 )


月曜日から金曜日に章が分かれていてメタプログラミングを学んでいく

ProductName メタプログラミングRuby
Paolo Perrotta
アスキー・メディアワークス / 2940円 ( 2010-08-28 )


バリバリEmacsを使っているEmacs使いが、作業効率をカイゼンしてさらにバリバリ使うようになるための本

継続やYコンビネータを知るために。独特の形式もまた読んでて楽しい

ProductName Scheme手習い
Daniel P. Friedman
オーム社 / 2940円 ( 2010-10-22 )


創薬研究の問題解決の方法論としても参考になることは多い

ProductName Redmineによるタスクマネジメント実践技法
小川 明彦
翔泳社 / 3444円 ( 2010-10-13 )


マーケットインとかプロダクトアウト

最近、社内の会議とか打ち合わせをしているとげんなりする事が多い。特に多いのが、マインドがプロダクトアウトすぎるということだ。

もともと、なんでゴールから逆算して考えるってことができないのかなぁと常々不思議だったのだが、プロダクトアウトの視点しか知らないからなんだろうなぁと気づいて納得した。

そもそも研究者は、頑張って成果物を出してみて、その後それが役に立つか評価してもらおうという思考のヒトが多いが、それは新しい物をつくるからであって、me-too drugを作っている労働者には全く必要ない思考なのではないか?むしろ、マーケットインの視点ありきでおまけというかタンポポ的にプロダクトアウト色をだしていけばいいんじゃないかなと思った。

逆の立場だったら、あんたの成果物買いたいと思うの?って聞いたら、うーんとか首捻っちゃうんだもん、不思議だよなぁ。

なんかマーケティングの本とか薦めてあげないとあかんよなぁと思ったけど、自分は普通に知っているので、実際どういう本を読んで勉強してもらえばいいかわかんなくて悩んでいる。

もしドラみたいなのあればいいと思うんだけどなぁ。僕はもしドラ読んだことないんだけど、もしドラには標記の内容に触れていますか?

「即戦力は3年もたない 組織を強くする採用と人事」を読んだ

今の枠組みの中で考えたらそうなんだろうなぁ、となかなか面白く読めた。レビューにもあるようにそもそも人事制度がダメだから企業文化がダメという話はなかったのが気になったけど。

会社という入れ物に労働力を当てはめるという立場に立てば筆者の言うとおりなんだろうけど、個人のスキルを持ち寄って集まったものが会社という形態をとると考えれば主張はあちこち崩んじゃないのかなぁと思ったということです。著者が言うとおり、OJTとか会社が育てるという体力なんてなくなってきてるので、結局のところ社会全体が後者のほうに向かっていると思うんだよなぁ。その状況で今までの会社形態の中でどうにかしようというあたりに違和感を感じるけど。さらに、そのような状況で人事部に求められるものとかは著者の書いてるようなものとは違うと思うし、そもそも人事部ってそんなに重要な部署か?と。

すくなくともうちの人事部は (略)

ProductName 即戦力は3年もたない 組織を強くする採用と人事 (角川oneテーマ21)
樋口 弘和
角川書店(角川グループパブリッシング) / ¥ 760 ( 2010-12-10 )


  • 企業側としては、新卒採用した人材に関しては、数年間は「育てる意識」を持っているものですが、中途採用した人材に対しては「成果をだせるかどうか」という物差しで測る
  • 確かにそうだが、そう簡単に辞めさせることができないので、新卒も中途もそんな変わらない。中途だと、すぐに組合の役員をやるという裏技もあるし(能力なくても大丈夫)。
  • 「3年だけ使えればいい」という現実的な発想をもつ企業が増えている
  • 採用も競争の厳しい「ビジネス」
  • 向上心の強い社員を飽きさせない
  • 会社は社長以上の人材を採用できない
  • 研究所は研究所長以上の人材を採用できないとも言い換えられる
  • そもそも上司というものは部下や顧客の見方が一番ただしい
  • 「これから新たな会社で頑張ろう」と力を発揮できるのは、過去にも頑張ってきたひとだけ
  • 一つの企業に長く勤めていれば「賃金が上がり続ける」という仕組みはどこかで限界に達するのは自明
  • 私たちの賃金低下は、対ドルレートの給与を踏まえ世界ベースで見たときに、労働の付加価値とマッチする段階まで進行していく
  • これからは「資格」「ノウハウ」「経験」はあまり重要ではなくなる

最近欲しい本

混合効果モデルの本の和訳出てた。英語版持っているけど、これは欲しい

ProductName S‐PLUSによる混合効果モデル解析
J.C. ピネイロ,D.M. ベイツ
シュプリンガージャパン / ¥ 7,140 ()
在庫あり。

MDの本

ProductName Ab Initio Molecular Dynamics: Basic Theory and Advanced Methods
Dominik Marx,Juerg Hutter
Cambridge University Press / ¥ 6,614 ()
通常1~3週間以内に発送

ProductName Numerical Simulation in Molecular Dynamics: Numerics, Algorithms, Parallelization, Applications (Texts in Computational Science and Engineering)
Michael Griebel,Stephan Knapek,Gerhard Zumbusch
Springer / ¥ 4,676 ()
通常2~4週間以内に発送

「「若者はかわいそう」論のウソ」を読んだ

Joe's Labo見てから読んだから1章しか読んでないというか、読みにくかったので途中でやめた(読む本なかったら対談のあたりは読んでおこうかな)。

データの後によくわからないたとえがあったりとか、そこからデータに基づかない著者の思いとか主張に発展したりしているかなぁ。論文読んでる感じでデータと文章追いかけるとひどく混乱する。

本読んでて疑問に思ったのは著者の主張している、「日本企業的スローライフ」はサステイナブルなのかなぁ?(または現在存在しているのか?)というところかなぁ。自分のみた感じだと、「日本企業的スローライフ」に当てはまるのは「仕事できないけど組合大好きで、横並び主張ばかりするダメ人間」しかいないような気がするが。

ProductName 「若者はかわいそう」論のウソ (扶桑社新書)
海老原 嗣生
扶桑社 / ¥ 798 ()
在庫あり。