富士通、次世代データ群「Linked Open Data」の格納・検索技術を開発 | RBB TODAY

富士通、次世代データ群「Linked Open Data」の格納・検索技術を開発

エンタープライズ ソフトウェア・サービス

LOD活用基盤の概要
  • LOD活用基盤の概要
  • 検索アルゴリズムの概要
  • 検索インターフェースの実行例
 富士通研究所ら三組織は3日、世界中で公開されている互いにリンクが張られたデータである「Linked Open Data」(LOD)を格納し、一括検索するLOD活用基盤を開発したことを発表した。

 「Linked Open Data」(LOD)は、W3Cが推奨するWeb上での新しいデータ公開形式「Linked Data」形式で公開されているデータセット群。RDFを用いることで、特定アプリに依存しないのが特徴だ。2013年現在、約340の主要なデータ公開サイトがあり、全体では400億項目のデータ量がある。代表的なものには、オンライン百科事典であるWikipediaをLinked Data形式に変換した「DBpedia」などがある。英政府のデータ公開サイト「Data.gov.uk」でもLinked Data形式が採用されている。

 現在「Linked Open Data」として、学術・政府系を中心に多種多様なデータがインターネット上に公開されているが、個々のデータが別のWebサイトで公開されており、どこにどのようなデータがあるかを把握することが難しいという課題があった。

 今回、数百億項目にもおよぶLODを格納し、従来比5~10倍となる高速な検索アルゴリズムにより、格納データを標準的なAPI(Application Programming Interface)で一括検索できるLOD活用基盤を開発した。この活用基盤は、富士通および、アイルランド国立大学ゴールウェイ校の研究機関「Digital Enterprise Research Institute」「Fujitsu Laboratories of Europe Limited」により新たに開発された。

 同時に、リンク情報を含めてデータを可視化する検索インターフェイスにより、アプリケーションに必要なデータを視覚的に探索できる機能も開発された。これにより、アプリケーション開発者が個々のWebサイトを探しまわることなく、欲しいデータを即時に入手し、利用できるという。

 富士通研究所では、今回開発した技術をクラウド上に実装したLOD活用基盤を、今年中に無償公開する計画だ。
《冨岡晶》

関連ニュース

特集

page top