日立、2000時間の音声データから3秒で任意のキーワードを含む音声を検索する技術 | RBB TODAY

日立、2000時間の音声データから3秒で任意のキーワードを含む音声を検索する技術

エンタープライズ その他
 日立製作所は6日、任意のキーワードを含む音声を高い精度で高速検索する技術を発表した。

 同技術は、録音データを音素の記号列に変換し、音素がどのタイミングで出現するかをインデックスとして保存する方式を用いた検索を行った上で、音声特徴量を用いたより精緻な再検索を3回行い、段階的に精度を高めながら音声を検索するというもの。これにより、2,000時間の録音データの中から3秒でキーワードを含む音声の検索を可能としている。なお、同研究では、音声特徴量の学習、およびシステム性能評価に際して、国立国語研究所、情報通信研究機構、および東京工業大学が共同開発した「日本語話し言葉コーパス(CSJ)を利用している。」
《富永ジュン》

関連ニュース

特集

page top