産総研、インターネット上の音声情報を認識・検索するサービスを開始〜ユーザが協力で性能向上 | RBB TODAY

産総研、インターネット上の音声情報を認識・検索するサービスを開始〜ユーザが協力で性能向上

ブロードバンド その他

サービス図
  • サービス図
  • ポッドキャストに対する全文検索の画面例
  • 音声認識の誤認識をユーザーが簡単に訂正できるインターフェースの画面例
 独立行政法人 産業技術総合研究所のメディアインタラクショングループは、インターネット上にある日本語の音声データ(ポッドキャスト)を対象とした全文検索サービス「PodCastle(ポッドキャッスル)」を12日に一般公開した。

 同グループで開発された、ユーザが協力すると日々性能が向上する音声情報検索技術をもとにしており、不特定多数のユーザーが簡単な操作で誤認識を訂正できる。その訂正結果を学習・反映させることで、音声検索性能と音声認識性能を共に向上させることが可能になったとのこと。さらに、インターネット上のニュース記事や辞書等から新しい言葉を自動学習する技術も開発されたという。

 「PodCastle」では、日々自動収集しているポッドキャストを、音声認識でテキスト化(自動書き起こし)して索引付けておき、ユーザが入力した検索キーワードと照合して全文検索結果を表示する。また次々と出現する新しい言葉(固有名詞や流行語等)・前後のつながり(文脈)を学習し、より的確な認識を行うことができる。さらに、音声認識時に最終的な認識結果以外に可能性の高かった複数の候補も求めておき、ユーザは正しい候補を選択するだけで訂正ができるとのこと。

 本成果については、「第7回産学官連携推進会議」(6月14日〜15日@国立京都国際会館)にてデモンストレーション展示される予定。
《冨岡晶》

関連ニュース

特集

page top