産総研、音声でコンテンツを直接検索するシステムの実証サイトを公開 | RBB TODAY

産総研、音声でコンテンツを直接検索するシステムの実証サイトを公開

ブロードバンド その他

インターネット上の動画・音声等を音声・テキストで検索するシステムの構成
  • インターネット上の動画・音声等を音声・テキストで検索するシステムの構成
  • マルチメディアコンテンツの中の音声を頼りに特定の場面を検出した例
  • 通話録音データから特定の通話内容を検出した例
 独立行政法人 産業技術総合研究所(産総研)の情報技術研究部門 音声情報処理グループは8日、マルチメディアコンテンツを音声により直接検索する技術を使った実証サイトを公開した。

 一般的なブラウザーからアクセス可能で、インターネット上の動画サイト、音声サイトといったマルチメディアコンテンツに含まれる音声を直接検索対象とし、コンテンツ中のキーワードの検索を実現したものとなる。事前登録された辞書などは必要なく、どのような単語でもキーワードとして使えるとのこと。

 同システムは、音声を、一般的に用いられる音素のようなローマ字表記相当の単位ではなく、より精密な単位として「音素片(SPS: Sub-Phonetic Segment)」と呼ぶ精細な単位に分解・符号化し、マッチングを数値化して照合を行う。照合処理手法についても高速処理アルゴリズムを開発した。これにより、あらたな固有名詞や新語を含むインターネット上の大量のマルチメディアコンテンツを、メンテナンスなしにリアルタイムで検索対象にできるものとなっている。

  本技術は、インターネットや家庭での応用以外にも、コールセンターでの通話録音システムにおける音声検索機能や、大量のマルチメディアコンテンツを保有し、販売・配信する放送、教育など広範囲の応用が期待される。

 また、従来の音声認識では辞書が不可欠であるため、処理対象の言語に強く依存していたが、国際音声記号に基づいて音声学的に定義されているため、言語非依存の技術となっている。そのため、多言語化や方言などへも容易に適用できるほか、高齢者や障害者などのキーボード入力が難しい情報弱者でもアクセスしやすいマルチメディア情報サービスが可能となるとのこと。

 これらの研究・開発成果は、「産総研オープンラボ」(10月20日〜21日@産総研つくばセンター)で公開される予定だ。
《冨岡晶》

関連ニュース

特集

page top