神崎正英:リンクするデータの現状と展望

「リンクするデータ、リンクするサービス」の続き。

最初の講演は、The Web KANZAKIの神崎さん。会社を設立されているとは知らなかった。

内容は Linked Open Data (LOD) の概念とデータ同士をリンクするとはどういうことなのかについての説明だった。私は、Linked DataやLinked Open Dataという名称と概念はこの講演で始めて知った。その点だけでも私にとって有意義。

WWWの提唱者であるバーナーズ=リーが Linked Dataの4原則を提唱したらしい。

2007年にW3CにLODプロジェクトが発足し、公開されているデータベースをリンクしてどんどんとネットワークが増えているとのこと。私は計算機科学分野の論文インデックスDBLP周りしか知らなかった。W3C SWEO Community Project: Linking Open Dataに図がある。

現在は、Wikipediaをベースに作っているDBpediaをハブとして、LODのネットワークが構築されているらしい。DBpediaは、英語版Wikipediaから構造可能なデータをRDFとして抽出してつくられているとのこと。

データのリンクについては以下を行うことでリンクさせる。

  1. スキーマの共有(関係データベースで言うフィールド名、XMLデータベースでいうタグ名)の統一・共通化
  2. 入力されるデータ名の統一・共有化。たとえば、「Web」、「WWW」、「ウェブ」などがデータとして入力されたとき、一つの表現に統一したり、シソーラスを用いて同じものを指し示していることがわかるようにする。
  3. IDの唯一化。ある対象に対して、データベースごとに別のIDを与えられていることがあるので、これを唯一化することで、同じ対象に対するデータであることがわかるようにする。

Linked DataではRDFが核となるフォーマットの様子。

実際の利用例としては以下のとおり

  1. Geonames:地名にURIを与えることで地名に関するデータのハブとなる
  2. MusicBrainz:音楽に関する固有名の典拠。音楽版DOI、ISBN。
  3. BBCやNYTimesが自社のWebサイトにおいて、複数のエントリーをMusicBrainzなどを利用して、リンクさせている。
  4. FacebookもOpen Graph Protocolというもの使っているとのこと。

神崎さんいわく、セマンティックWebとLinked Dataの違いは、前者は推論を行うことが主目的なので、リンクするデータ同士が本当にリンクすべきものかを慎重に考える傾向があるが、Linked Dataの場合は、まずリンクしてみよう、そこから新たな価値が生まれるという発想のもと、積極的にデータ同士をリンクするという傾向があるとのこと。

私には、Webの成功例がある分、Linked Dataの方針の方が説得力を持つように思える。

その他検索していて見つけたページ。

岡本真:世界と日本におけるGov 2.0の現在に続く。