「富士山の高さは?」といった話し言葉で検索〜goo Wikipedia | RBB TODAY

「富士山の高さは?」といった話し言葉で検索〜goo Wikipedia

エンタメ その他

goo Wikipedia自然文検索
  • goo Wikipedia自然文検索
 NTTレゾナントは、「富士山の高さは?」といった日本語自然文で「goo Wikipedia記事検索」内の記事を検索できる「goo Wikipedia自然文検索」の実験を開始した。日本語自然文によるWikipedia記事の検索機能の提供は、国内主要ポータルサイトにおいては初の取り組みとなる。

 「goo Wikipedia自然文検索」は、「goo Wikipedia記事」の約48万件(平成20年6月現在)の記事を対象に、「安土城を建てたのは誰?」や「OPECって何?」といった話し言葉で表現された質問で検索することができるサービス。質問内容を解析し、「goo Wikipedia記事」の検索結果から質問の回答候補となりうる表現を判定・表示するとともに、質問に対する回答を含む可能性が高い記事を表示する。話し言葉で検索することができるため、ユーザは知りたい情報をより簡単に調べることができるようになる。

 技術ポイントとしては、「goo Wikipedia記事」本文からの回答抽出と「goo Wikipedia記事」からの知識の抽出の2点が挙げられる。本文からの回答抽出は、人名や地名などの名称、日付や金額などの数量、言葉の定義などの質問の種類を判定し、「goo Wikipedia記事検索」での検索結果から回答候補となりうる表現を抽出する。また、「gooWikipedia記事検索」での検索結果の記事内における表現の出現位置などから、質問に対する回答としての確からしさのスコアを計算し、スコアの高い順に表示する。

 一方、知識の抽出には、あらかじめ「goo Wikipedia記事検索」内の記事を解析して知識データベースを作成。入力された質問文と知識データベースをマッチングし、質問に該当する知識がある場合には、精度の高い回答を返すことができようになっている。例えば、「goo Wikipedia記事検索」内の「アイルトン・セナ」という記事を解析することによって抽出された「アイルトン・セナ」、「優勝回数」、「41」という表現から「アイルトン・セナの優勝回数は41回である」という知識を獲得し、知識データベースに蓄積。この「知識」を利用して、「アイルトン・セナの優勝回数は?」、「優勝回数が41回のF1ドライバーは?」といった質問に対して、それぞれ「41」、「アイルトン・セナ」と回答することができるようになっている。同社によれば、現在390万件の「知識」を蓄積しており、「goo Wikipedia記事検索」に新しい記事が追加されると「知識」も増えていくという。
《関口賢》

関連ニュース

特集

page top