NTT、文書に3階層のタグを自動付与する「階層的オートタギング技術」の実証実験を開始 | RBB TODAY

NTT、文書に3階層のタグを自動付与する「階層的オートタギング技術」の実証実験を開始

 日本電信電話(NTT)とNTTレゾナントは21日、文書を分析し内容を端的に表すタグを自動的に付与する「階層的オートタギング技術」の実証実験「QA.ON/OFF(キューエー.オンオフ)」(qaonoff.labs.goo.ne.jp)を開始した。

エンタープライズ ソフトウェア・サービス
3種類のタグを自動的に付与
  • 3種類のタグを自動的に付与
  • 「QA.ON/OFF(キューエー.オンオフ)」の画面
  • 主題タグの候補を自動的に用意
  • 重要な言葉をキーワードタグにして付与
 日本電信電話(NTT)とNTTレゾナントは21日、文書を分析し内容を端的に表すタグを自動的に付与する「階層的オートタギング技術」の実証実験「QA.ON/OFF(キューエー.オンオフ)」(qaonoff.labs.goo.ne.jp)を開始した。

 ポータルサイト「goo」で提供しているQ&Aサービス「教えて!goo」の質問回答データを分析し、その内容から「カテゴリタグ」「主題タグ」「キーワードタグ」という3種類のタグを自動的に付与するもので、実証実験サイト「gooラボ」にて行われる。ナビゲーション・ボタンとして、本技術によりあらかじめ各Q&A文書に付与された3種類のタグを活用し、それぞれのボタンをオン/オフして検索内容を絞り込んでいくことで、目的とする文書に辿りつくための手助けをする。本実証実験では、階層的オートタギング技術により付与されたタグが、ユーザーの検索行動において、目的の文章を検索するための有効な手段になりうるかについて、評価するのが目的。

 従来技術では、タグを付与するための学習データとして、ユーザーが各文書に付与したタグのデータを必要としたが、本技術ではカテゴリ分けされた文書集合のみを学習データとして、高いタギング精度が実現できる見込み。各カテゴリで主に扱われる話題を自動発見する「主題語発見機能」、カテゴリと主題語発見機能で発見した主題の集合をタグの候補として、文書中には含まれていない文字列でも、文書内容から統計的に推定してカテゴリタグ・主題タグの組を付与できる「階層分類タギング機能」、入力文書の構造を考慮して、文書中の具体的な文字列をキーワードタグとする「抽出タギング機能」などが活用される。カテゴリタグをもとにしたカテゴリボタンは検索の視点の切り替えに役立ち、主題タグとキーワードタグをもとにしたメイントピックボタンとサブトピックボタンのオン/オフは検索対象の絞り込み/拡大に役立つとのこと。

 利用には「goo」トップから「gooラボ」をクリックし、「QA.ON/OFF」のデモサイトをクリック。トップページに検索キーワードを入力、もしくは注目ワードをクリックすることで可能。NTTは本実験に必要な、階層的オートタギング技術を提供。NTTレゾナントは実験に必要な、Q&Aデータを「教えて!goo」より提供する。
《冨岡晶》

関連ニュース

特集

page top