drkcore

2008/03/18 22:57:52

論文からdoiを抜き出すperlのサンプル

文献はpdfを自作のイントラソーシャルブックマークサービスっぽいのを使って管理しているのだけど、pubmedにのるよりもペーパーの方が早かったりすることのほうが多く、pmidをつけることが出来なくてもどかしい思いをしてばかりいる。

use strict;
use warnings;
use CAM::PDF;

my $pdfname = $ARGV[0];
my $pdf = CAM::PDF->new($pdfname);
my $page1 = $pdf->getPageContent(1);
my ($result) = $page1 =~ m!\d+\.\d+\/.+?(?=\))!gx;
print $result if $result;

抽出したdoiをeutilsに問い合わせて、あとは適度な塩加減を加えつつゴニョルとよさげ。

で、そのソーシャルブックマークサービスはpmidをプライマリキーにしてるもんだから始末に負えない、というかそのうち、匠的にリフォームする気概で、今日もだましだまし使った。

Comments