読者です 読者をやめる 読者になる 読者になる

私の論文メタデータ管理法

研究 メモ

あの笹田さんに楽しんでいただけて光栄至極。一回だけお目にかかったことがあります。

http://d.hatena.ne.jp/next49/20080214/p1
大変楽しかったのだけれど,ここで大笑いしてしまった.

場合によっては、ここいらへんでスキーに行くのも良い。先生に絶望感を与えられる上に、君は楽しいという一挙両得のアイデアだ。

もし、これを本当にやられたら私は3日は寝込みますね。

で、同じく笹田さんが日記で以下のようにつぶやかれていましたので、私の論文メタデータ管理方法をご紹介。

文献リストをまじめに管理しようと思うのだけれど,どうすれば自動化が簡単になるか.
年代順とか,査読付き論文誌とか,国際会議とか,そういうのを簡単に管理する方法.

はじめに

ちなみに全然、自動化されいません。私は、LaTeXで論文を書くのでBibTeX(jBibTeX)で論文のメタデータを管理。PDFファイルはBibTeXのbibnameと同じファイル名にして、ローカルのディレクトリに分類しないで放り込んでいます。

まず、論文をダウンロードするまでと実際に論文に参考文献として記載するときの2つに分けて管理しています。

論文検索〜ダウンロードまでの段階の論文メタデータの管理法

CiteULikeで論文情報を管理しています。いつのまにかSpringerがスポンサーについていてびっくり。

CiteULikeの良い点は以下のとおり

  • BibTeX形式でメタ情報をダウンロードできる
  • BibTeX形式でメタ情報を入力できる
  • メタ情報のインポート機能が多くの学会や出版社の電子図書館に対応している
  • プライベートブックマークができる
  • 日本語も使える

私が入手できる論文のデータベースは、ACM Portal(個人で購入)、IEEE-CS Digital Library(個人で購入)、ScienceDirect(所属大学の図書館が購入)、SpringerLINK(欲しい論文があれば個別に購入)であるため、CiteULikeの使い勝手は相当良いです(この5つの論文データベースに対応している)。

ダウンロードした論文のPDFファイルは、Bibnameと同じにしているので、探すのも案外簡単。現在の命名規則は以下のとおり。

名前_キーワード_会議or雑誌名+巻号数+西暦下二桁.pdf

名前は、「ファーストネームのイニシャル.ファミリーネーム」で管理。著者が二人以上でも第一筆者の名前だけを使って管理しています。たとえば、麻生太朗さんが、日本アニメ学会(Anime Society of Japan)で2008年に発表した論文は、「T.Aso_Anime_ASJ08.pdf」として名前をつけています。

ダウンロードした論文が必ずしも役に立つわけではないので、毎回BibTeXのファイルの方に書くのは面倒です。そこで、CiteULikeを使って、出来る限り簡単に出典を記録しておきます。

なお、ダウンロードする段階で役に立とうが立つまいが、メタ情報を記録しておくことを強く勧めます。メタ情報を後から調べるのは大変です(修士時代何度もこれをやってえらい時間がかかった。著者名と論文タイトルだけから、会議名や雑誌名を探すのは案外面倒)。

実際に参考文献として使う段階の論文メタデータの管理法

実際に参考文献として使う段階になったら、CiteULikeからBibTeXファイルに転記します。ただし、直接、BibTeXファイルをいじるのは不便なので、jabrefというフロントエンドを使っています。

JabRefは、BibTeXファイルをデータベースだとみなして管理してくれます。BibTeXの記法がわからなくても項目を埋めていけば自動でBibTeXファイルを生成してくれます(これは、CiteULikeと一緒)。

参考文献として使いたい論文のメタ情報をCiteULikeからJabRefに転記します。具体的には、CiteULikeBibTeX記法のページを表示し、それをJabRefにコピーアンドペーストするだけです。

JabRefはJavaで動くので、Linux上でもWindows上でも動く点がポイント高いです。また、ローカルに保存されているPDFファイルとの関連づけができるのもGood。

おわりに

2つのソフトウェアを用いて似た作業を繰り返しているのでDRYの原則からはずれますが、ダウンロードした論文をすべて参考文献につかうわけではないので、コストパフォーマンスの点からはこれでよいかなぁというのが現在のところ。CiteULikeにすべてをまとめたいという誘惑もないではないですが、CiteULikeに論文のPDFファイルをアップロードするのは著作権上問題があるので現状無理。

以上、ご参考まで。