現在ちょっとした文献管理システムを作っています(doiで管理できるやつ)。今使っているのはlast.fmや、deliciousみたいなSBSにインスパイアされて5,6年前に作ったのだけど。
last.fmは曲だけどmendeleyは文献だからなストリームとしての文献ってなんだろかね?
- 世界中のMendeleyを使う研究者とつながることができ、同じ分野の研究者が何を読んでいるかを知ることができること
他の研究者の読んでる文献がわかったからどうなの?ということです。先っぽにいれば、重要な論文は大体みんな読んでるからなぁ。
自分でサービス作って運用してまわりの反応みてみたけど、設計としてもう少しいい方向を模索すべきだなという結論になった。
あとでもうちょっと丁寧に書くかも。
で、doiは
10.[出版社コード]/[出版社で勝手に決めた文字列]
というようにスラッシュが含まれているのでURL中にdoiを含めたい場合には/をどうにかしないといけないですね。
Flaskの場合はpathっていうconverterを書いておけばよろしくやってくれます。
@app.route('/entry/<path:doi>') def show_entry(doi=None): if doi == None: abort(404) entry = db_session.query(Entry).filter(Entry.doi == doi).first() if entry == None: abort(404) else: return render_template('show_entry.html', entry=entry)
それから、pdfからdoiを抜き出したい時にも[出版社で勝手に決めた文字列]のところでうまい正規表現がつくれなかったり、pdfからテキストを抽出する段階で文字がつながってしまったりしてdoiがきちんと取れてこれなかったりして残念度が高いです。
ていうか、pdfなんだからメタデータにきちんとdoiいれとけよなーと。