武田英明:日本におけるLinked Dataの課題とその解決への試み

「リンクするデータ、リンクするサービス」の続き。

3番目の講演は武田さん。

講演の肝は以下のとおり(2番目はかなり意訳)。

  1. 情報とは使われなければしょうがないものなので、情報公開&共有はしなければならない
  2. 公開されている情報を使っていろいろやっているのに、自分の情報は出しませんというのはおかしい
    • 公共=官ではない。官は公共の一部を担っているだけ。
  3. 嘆いていてもしょうがないので、まず、自分達で始めてみよう!

で、実際にLODACというプロジェクトを開始し、日本で公開されている美術館・博物館情報を統合して、美術と博物についての基礎インデックスを作るというプロジェクトLODAC Museumを実施しているとのこと。LODAC Museumはeuropeanaを参考にしているとのこと(欧州文化遺産のマルチメディア図書館「Europeana」一般公開

その他、記憶に残っていることをメモ。

  • LODACで日本版DBpediaを準備中。近日公開予定とのこと
  • Linked DataではデータごとにURIを与えることが重要だが、識別IDに日本語をつかうと文字コードの問題で、各種ツールが動かないときがある(原理的にはIRIでOKのはずだけど)
  • LODAC Museumで行ったような公開されているデータの連携と複数のデータベースの統合の違いは、公開されているデータの連携を行う場合、データベースは手元になく分散していること。
    • 公開されているデータしか知ることがdけいないので、各公開組織が全部でどれほどのデータを持っているのか、データ連携を行う側では把握できない
    • どのタイミングでデータの更新や削除があるのかデータ連携を行う側では把握できない
    • データのフォーマット(スキーマ)、公開の仕方の変更について、データ連携を行う側からは止めること/強制することができない
    • 欧州は言語が似ているため、単語同士を一対一対応で翻訳できるので、メタデータを英語に統一することについてあまり問題が起こっていない様子。一方、日本語を英語に翻訳する際にやゆらぎが生じるため、同一データのリンクに失敗する可能性がある
    • 英語でメタデータを作る場合は、日本語で作る場合に比べて手間が生じる
    • 日本語のままでメタデータを作ると、非日本語圏では利用できない

江渡浩一郎:DataWikiを実現するWedataの構築と運用へ続く。