Lingua::JA::SummarizeとHyper Estraierでsimilar_entryプラグイン

Lingua::JA::Summarizeの特徴語をHyper Estraierで検索できるようにしたので、類似のエントリを表示するblosxomプラグインを書いた。
個別のエントリの下のほうに5個表示するようになってる。

色々眺めてみてるけど、短いエントリは精度が悪いのと、単純にOR検索だとあんま思ったような結果が得られない。やっぱ適当な重み付けが必要なんだろうナァ。

estseek.cgiの場合はこんな感じで評価するようだ。

User's Guide of Hyper Estraier Version 1 (Japanese)

estseek.cgiの場合、「[similar]」というリンクを選択すると類似検索を行うことができます。類似検索の結果は類似度の降順に並べられます。類似度はベクトル空間モデルという考え方に基づいて算出されます。文書からキーワードを取り出してベクトルとして表現し、ベクトル同士のなす角の余弦を類似度とするものです。

あとでこれ読む

warnとcarp,dieとcroak

違いをやっと理解した。

perlnewmod - 新しいモジュールを配布するには

Carp モジュールを使うと、エラーメッセージを呼び出し側の視点から出力することが出来ます。そのモジュールではなく、呼び出し側の問題であることを示せるのです。
...
もし die する必要があるなら、croak を使いましょう。ただ、本当にあなたのモジュールの責任によるチェックの場合は、warn や die のままにしておきましょう。

warnだと、

No hostname given at /usr/local/lib/perl5/site_perl/5.6.0/Net/Acme.pm
line 123.

となるが、carpだと

No hostname given at bad_code, line 10.

というふうに、エラーメッセージを呼び出し側の視点から出力することが出来る。

CGI書くときにおまじないのように使っていた、

の謎が解けた。

薬を処方されたので構造を描いてみた

一昨日から下腹部(しかも右)が痛い。うーん、ゲレンデが遠のいているというかちょっとヤバいかなってことで、休みをとって病院に行ってきた。虫垂っぽいんだけど、よくわからんので経過を観察しましょうってことで、薬を処方された。

シプロキサンとセレキノン。

手動かす元気はあるので、以前作ったツールで構造描画でもしてみた。

シプロキサン smi2png -w 200 -h 200 -o Ciprofloxacin.png "C1CC1N2C=C(C(=O)C3=CC(=C(C=C32)N4CCNCC4)F)C(=O)O"

Ciprofloxacin

セレキノンはsmi2pngでもiupac2pngでも構造描画することができなかった。

The Perl Review

The Perl Review

60% off the Online Version: Subscribe to TPR this month to get 60% off the web only version, now available to everyone including those in the US.

購読した。

Love Tribe

ジャズトロのニューアルバムで、とりあえず買いな一枚

ProductName Love Tribe
Jazztronik
ポニーキャニオン / 1963円 ( 2007-01-01 )


love tribeはいいがちょっと爽やか過ぎ。Life Syncopationが最高でした。ゆるゆるオチル、音響っぽくてはまる。そして、本アルバムにはTigerEyesの英語バージョンが入っているが、Monday満ちるがうたっとる。懐かしすぎ。結構ライブ行ったし、メトロにもたまに出てた時は必ず行ってたくらい好きだったな。

2枚組みだが、僕は2枚目の流れのほうが好き。特に5-6の流れがなんともかんとも。そしてインコグ懐かしい。アシッド・ジャズ回帰ってあるんだろうか(あったんだろうか)?

SporkでHTMLスライドショー

Sporkでプレゼン用のスライドを作ってみた。

インストールは

$ cpan -i Spork

で。あとはKwiki::Cacheなんかも入れておかないといけないような。

スライド作成の流れは以下の通り。

mkdir my-slideshow # スライド用の
cd my-slideshow    # ディレクトリ作成
spork -new         # 新規spork
vim Spork.slides   # スライドファイルを編集
vim config.yaml    # 設定ファイルを編集
spork -make        # スライド作成

スライド作成の文法はKwikiスタイル。サンプルみながら書き換えてみた。テーマはSpork::S5Themeを使ったのがこれ

PowerPointもアウトラインの編集だけで、動作の書式設定できるようにすればいいのに。

Win32::PowerPoint - helps to convert texts to PP slides - search.cpan.org

Win32::PowerPoint mainly aims to help to convert Spork (or Sporx) texts to PowerPoint slides. Though there's no converter at the moment, you can add texts to your new slides/presentation and save it.

確かにWin32::PowerPointでコンバートできたら便利に違いない。

Kwikiにはてな認証入れた

この2日間はwikiを巡って色々あった。

昨日: あら~書き換えられとる

ちょっとKwikiに駄文を書き散らかしておくかなと、ページを開いたら、トップページに

h4ck3d

トルコのほうからコンニチワってな意味でしょうかね。てかwikiにhackedとは。愉快犯的なbotかなぁと(書き換えられたのはHomePageだけだしなぁ)とりあえずボット対策でもしておくことにした。

Kwiki::Edit::RequireUserName を入れとけば、アノニマスの書き込みは禁止されるので、とりあえず、ロボット対策にはなるかな。それから、Kwiki::Notify::MailでWikiに書き込みが行なわれたらメールで通知するようにしておいた。

ついでにテーマもKwiki::Theme::BluepoleからKwiki::Theme::PerlMongers に変えてちょっと見栄えがよくなった。

Sporkも使いたいと考えていたので、MarkdownからKwiki文法に戻す作業もついでにおこなった。そのため、今までmarkdown書式で書いてたページが化け化けになってしまったが、これはあとで書き直そうとこの日の作業は終了。

今日: あれ~また書き換えられとる

朝起きて、メールを見たら、WIkiから変更通知のメールがいっぱい来ていた(といっても5通くらい)。寝てる間に書き換えられてた。

HACKED

またもやトルコから。しかも直球勝負でひねりもなんもなし。アノニマスの書き込みが禁止されているので、ちゃんとユーザー設定(メモリというユーザー名だった)してから書き込んでた。全部書き換えちゃってるし。まったくもってご苦労さまだ。

今後Wiki使うのにやっぱり認証は入れねばならんナァと、以前から興味のあったはてな認証を試すことにした。

Kwiki::HatenaAuthをインストール。Kwiki::UserNameとKwiki::Edit::RequireUserNameははずさないとエラーになるので注意。

これで、認証が通ると修正用のEDITボタンが出るようになったんだけど、Kwiki::NewPageのNEWボタンは常に出っ放しなので、後でKwikiのソースを見てみよう。

WEBアプリ認証の話は、WEB+DB PRESS Vol.34が詳しい。

ProductName WEB+DB PRESS Vol.34

技術評論社 / ?円 ( 2006-08-24 )


ページが全部消されちゃったけど、書き始めのものがほとんどだし、ほとんどページのバックアップがあるのであんまダメージはなかった。むしろ、認証の設定を試すいい機会になったかも。

これで、Wikiのほうにも色々書いていく準備ができた。

バイオプログラミング―バイオインフォマティクス演習

bioinformatics,chemoinfomaticsのあれこれをc++で解説してある本。でも、解説は少なめ、ソースコードまんまのせすぎめ。写経にはちょうどいいので、今は夜な夜な写経してる。

分かりやすく言うとソースコード集。もっと分かりやすく言うとビッグワンガム

  • ソースコード:プラモ
  • 本文+注釈:申し訳程度のガム

と考えればよいかと。

どっちかというとクックブック的な構成なのだけど、Makefileが全章分まとめて作ってあるのはいただけない。項目ごとに個別のコードを動かしたいときにはMakefileを書き直す必要があるし、章ごとに完結していないので使いづらい。さらに、ソースコードはオーム社のページからダウンロードできますと書いてあるのに関わらず、本の記載にはない変更箇所がちょこちょことが見受けられたりして紛らわしい。(あとはアーカイブにスワップファイルが含まれてたりとか)

読む本としてみた場合に、全体的にちぐはぐ感があるのは、まずコードありきで、執筆の為に本文適当にでっち上げたからなんでしょうなぁ、などと邪推してみたり。擬似コードなどでアルゴリズムの概要を示したりとか、解説しているコードの場所をきちんと明示するようにして欲しかった。

だから、対象読者も初学者とか、情報系でバイオインフォに興味があるというヒトではなくて、本に載ってるようなツールを既に使っていて中身がどうなってんのか知りたいとか、LLで遅い部分を速くするためにcとかc++で書き直したいナァと考えているヒトが対象でないかと。(かなりニッチな気が)
まぁ、本書の「はじめに」にソースコードをじっくり読んで欲しいって書いてあるし。

読む本としては、読みづらいところが多いが、C++でバイオインフォ、ケモインフォのコードを解説している本はあまり見かけないので貴重だし、僕はSWIG使ってPerlから使えるようにしたかったのでjavaでなくC++の本を探していたために★x4.5ぐらいの満足度。使いたいヒトというよりは作りたいヒト向けの書籍だ。

で、正月休みを利用して、C++入門と適当な入門書を本屋で購入して一通り読んでから、写経を始めてるが、結構楽しい。

テトリスDSのWi-Fi対戦が面白すぎることにやっと気付いた

ぶらっと電気屋に寄ったら、目についたので買ってみた、、、、が、

wi-fi対戦最高だ(モエル!)

いままで、テトリスごときに4K近くも出せるか?と思ってたんだけど、対戦楽しすぎ。なんで今まで買わなかったんだろうか?と思うくらい。

とはいえ、僕はレベル2くらいのコンピューターになかなか勝てないくらいの腕だけど。

ProductName テトリスDS

任天堂 / ?円 ( 2006-04-27 )


連鎖の気持ちよさだとぷよぷよのほうが。

ProductName ぷよぷよ!

セガ / ?円 ( 2006-12-14 )


これもWi-Fi対戦で熱くなりそう(そのうち買いそう)。

ボードトリップに必携の予感。っていうか、そろそろ滑りに行かなきゃ。

WindowsXPでGDB

WindowsXP上でMSYS使ってC++いじりをしている関係上、WindowsXPでGDBを動かしたい。

C-Compiler Wiki MinGW > GDB のインストールを参考にGDB入れた。使い方がちゃんと分かってないのでとりあえずperl -dのノリで使ってみている。

ProductName Binary Hacks ―ハッカー秘伝のテクニック100選
高林 哲
オライリー・ジャパン / 3360円 ( 2006-11-14 )


とか欲しいかも。てか年末結構捌いたはずのウィッシュリストがどんどん溜まっていく、、、

アマゾン病だ、そうに違いない。