2011/03/02 21:57:30
javascriptでDOM操作しまくっているサイトをスクレイピングする作業が発生しそうなのだけどWWW:Mechanizeではできないらしくて、ちょっと調べてみた。
すぐに思いついたのはWWW::Seleniumなんだけど使ったことないなぁ。で、CPAN探したらWWW::Mechanize::Firefoxを見つけたのでインストールして使ってみた。
僕のブログの404ページはページがロードされると、AjaxでtagのJSONをゲットしてきて表示するようになっているので、そのページのスナップショットを撮ってみた
きちんとjavascriptを解釈している
use WWW::Mechanize::Firefox;
my $mech = WWW::Mechanize::Firefox->new();
$mech->get('http://blog.kzfmix.com/404');
my $rect = {
left => 150,
top => 0,
width => 500,
height => 400,
};
sleep(3);
my $png = $mech->content_as_png(undef, $rect);
open my $fh, '>', 'page.png' or die "Couldn't save to 'page.png': $!";
binmode $fh;
print {$fh} $png;
close $fh;

それから当たり前だがアクセスログのUser-Agentは
Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.5; ja-JP-mac; rv:1.9.2.13)
Gecko/20101203 Firefox/3.6.13
とFirefoxのものとなる。
というわけで、WWW::Mechanize::Firefoxを使ってスクレイピングをすればjavascriptでDOMを組み立ててるサイトやAjaxで通信しているサイトでもいけそうな気がしている。その後はWeb::QueryでDOMいじりをすればよさそうだ。
FrePanをいまさら知った。LDRでフィードを購読するようにしといた。
2008/11/25 19:41:57
読み流した感じ。
- FireGestures
- LDR Full Feed
- APNG(pngでアニメーション)
- Microformats
2008/01/10 20:09:12
ちょっとしたきっかけで、firefoxのタブをホームのアイコンにドラッグドロップするとホームページに設定されることに気がついた。
ドラッグしてくれーというアイコンからの声は聞こえないなぁ。
2007/11/07 21:57:30
livedoor clipのブックマークレットにはcを、livedoor readerの購読ブックマークレットにはsのキーワードを設定しているので、ロケーションバーに移動してそれぞれ入力するだけで登録できるようにしてある。
ただ、ロケーションバーの移動のショートカットがC-lなので、Emacsユーザーの僕としてはC-l,C-cとかC-l,C-sとかコントロールキーを押したままのほうが自然なキーストロークなんだけどfirefoxのキーワードにCtrlを定義できなかった。
でもやっぱ途中で小指を離すのはなんか気持ち悪いなあ
2007/08/19 23:04:06
個人用ツールバーフォルダにfavidonだけ表示させて簡易ボタンとして使うのは便利だ。
だが、キーボードショートカットとかキーボードで操作できると便利だと思うんだがやり方がわからない。
Alt-bでたどるってのもぁ、、、
2007/05/18 22:38:34
Firefox2.0だとRSS開いたときに、デフォルトで登録するRSSリーダーを選べるようになってて便利だ。早速LDRに変更してみたが、

イントラのRSSもLDRに登録しようとしてしまうので、ちょっと嫌な感じ。
やっぱブックマークレットにスマートキーワードつけるのがいいのかも。
2007/02/10 22:37:34
ここ何日かHTTP(S)の通信追ってきて、curlとかWWW::Mechanizeのトレースモードをずっとみてた。
で、ブラウザのヘッダーの追っかけが、かなり役立ったんだが、この
LiveHTTPHeaderの便利さを改めて実感した。
でも、ヘッダーだけだとわからないことも多かった。特にプロキシ介する場合に結局どこに問題あるのかイマイチ判明しないのには苦労させられたな。
2007.02.10追記
Webクライアントプログラミングの最初のほう読むと、LiveHTTPHeaderを結構使えるようになると思うんだけど。
が、絶版みたい
2006/10/18 23:45:24
個人用ツールバーフォルダにつけてるボタンは名前を空欄にしたほうがアイコンチックになってすっきりしてみやすいことにいまさら気付いた。

ブックマークレットもアイコンにならんもんじゃろか?増えてくるとあれ~~?とか一瞬悩むことは増えるので。
2006/08/28 20:07:24
あれ、LSDって昔はpdic形式のデータ配布してたよなァと思いつつ、探してもみつからないので英辞郎みたいに右クリックで検索できるようにしてみた。
http://lsd.pharm.kyoto-u.ac.jp/cgi-bin/lsdproj/ejlookup04.pl?query=$
を拡張機能で設定。

で、実行すると新しくタブが開いて検索結果が表示されるようになったとさ。

pubmedのアブストをRSSリーダーで流し読みしてるときなど便利。
2006/07/28 21:00:29
今年は早めに休暇をとって、帰省することにした。
で、ワンコと赤ちゃん連れて帰るために、荷物が増えてノートパソコン持ち歩くのがいやだけど、実家のコンピュータの環境だと、ネットのチェックしづらいので、Portable FirefoxとGoogle Browser Syncを試すことにした。
もらいもののusbメモリにマイブラウザを持ち歩くというわけだ。

USBメモリブートが一般的になれば、KNOBな解析環境も持ち歩くようになるのかな。