NICT、世界初のWeb情報解析システム“WISDOM”を公開 ~5億を超える日本語ページから多様な意見を抽出 | RBB TODAY

NICT、世界初のWeb情報解析システム“WISDOM”を公開 ~5億を超える日本語ページから多様な意見を抽出

エンタープライズ ソフトウェア・サービス

試しに「AKB48」について分析した結果(分析レポート)
  • 試しに「AKB48」について分析した結果(分析レポート)
  • 試しに「AKB48」について分析した結果(検索結果)
  • WEB上でどういう人々がどんなことを発信しているか把握
  • WEB上に主にどのような情報があるのか、対立情報を含めて表示
  • 検索結果中の発信者の分布や、発信者ごとの意見の分布
  • さまざまな立場の発信者の肯定的・否定的な意見を読むことが可能
  • 情報解析システム“WISDOM”
 独立行政法人情報通信研究機構(NICT)は9日、発信者の分析、評価情報の抽出、対立する情報の抽出などさまざまな観点からの分析が可能なWeb情報分析システム“WISDOM”(Web Information Sensibly and Discreetly Ordered and Marshaled)を公開した。

 情報分析システム“WISDOM”は、NICTが独自に収集した5億を超える日本語Webページを対象に、任意の話題に対して「外観」「発信者」「内容」という3つの観点からの分析を行うことが可能となっている。利用規約に同意すれば誰でも利用可能だ。

 “WISDOM”には、「Webページを発信しているサイトの運営者や、ページ内のコンテンツの著者を、自動的に抽出する技術」「情報発信者の特定のトピックについての専門性を分析し、専門性の高い順に順位付けする技術」「意見や評価を自動的に抽出し、それが肯定的か否定的かの評価極性を判定する技術」などが新たに開発されたとのこと(情報発信者分析技術、評価情報抽出技術、主要・対立・対比情報抽出技術)。これらの技術により、従来の検索エンジンでは難しかった、特定の話題に関するさまざまな立場の発信者の意見や対立する情報を俯瞰的に提示することで、多様な観点による偏りの少ない情報を元にした判断が可能となるという。

 従来、Webから評判情報を検索するシステムは存在したが、Webコンテンツを対象に、評価情報に加えて発信者や対立する情報など多様な観点から分析できるシステムは、“WISDOM”が世界初とのこと。今後は、精度向上を図るとともに、常に最新の話題に対応できるよう継続的に分析対象を更新する。また、英語版および中国語版の開発を進めていく予定。

 国立国会図書館の長尾真館長は「グーグル検索に何が欠けているかを、私がNICTの理事長をしていたときにいろいろと考えた。そこで浮かび上がってきたのは、検索上位の情報がどこまで信頼できるものであるか、それらに対立するような情報がロングテールのどこかにないかどうか、といったことを自然言語処理技術であきらかにすることであった。そこでさっそくプロジェクトをスタートさせたが、それが今回のWISDOMという世界に類例のないすばらしい成果となったことはまことに喜ばしい。多くの人に使ってもらいたいものである」とのコメントを寄せている。
《冨岡晶》

関連ニュース

特集

page top