肌の振動を光学センサーで検知!イスラエル発スタートアップの「高精度音声ピックアップ技術」【MWC 2016 Vol.39】 | RBB TODAY

肌の振動を光学センサーで検知!イスラエル発スタートアップの「高精度音声ピックアップ技術」【MWC 2016 Vol.39】

エンタープライズ モバイルBIZ

VOCALZOOMのスタッフ
  • VOCALZOOMのスタッフ
  • 人の肌の動きを光学センサーで認識して発声を高精度にピックアップするVOCALZOOMの技術展示
  • 多くのベンチャー企業でにぎわう4YFNの会場
  • 極小サイズのレーザーピックアップを使用
  • 雑踏の中でも人の声だけを正確にピックアップする
  • デモ機でピックアップした音声は、上側に通常マイクによる集音結果、下側にVOCALZOOMの技術による集音結果を分けて表示。効果を聞き比べることができた
 スペイン・バルセロナ市内にて「MWC 2016」と同じ期間に併催されている、スタートアップを中心とした展示・カンファレンスのイベント「4YFN(4 years from now)」にて、ベンチャー企業、VOCALZOOMが独自の光学センサーをつかった音声ピックアップ技術を出展している。

 イスラエルに拠点を構えるVOCALZOOMは、光学センサーや音声認識のスペシャリスト。人間が発声する際に振るえる顔の皮膚の動きを、人体に影響のない微弱なレーザー光で検知して、場合によって高性能なマイクユニットを併用しながら集音することで、騒音環境の多い場所でもノイズを抑えた高感度な音声ピックアップを可能にするという独自技術「Human-to-Machine Communication」を開発。モバイル端末や自動車メーカーを中心に技術提供を始めた。中国のiFLYTECH社とは、同社のクラウドベースの音声認識プラットフォームとの技術提携を発表している。

 会場では同社のピックアップシステムと、通常の単一指向性マイクを乗せたデモ機材により、話者の声を同時に拾ってクリアな音声の違いを聞き比べることができた。VOCALZOOMの技術では人の肌の動きにもフォーカスしているため、周囲の雑音に影響を受けることなく話者の声だけを驚くほど正確に拾えるのが大きな特徴だ。話者とレーザーピックアップとの距離はおよそ1mほど離れていても正確に肌の動きが検知できる。

 また1台のピックアップで正面方向60度の角度がカバーできるので、車載を想定した場合もフロントミラーなどにピックアップを設置することで、精度の高いハンズフリーシステムが構築できるメリットがある。例えば、カーラジオをかけながら、あるいは窓を開けた状態でもクリアな音声ピックアップができると同社のスタッフは説明している。

 同社ではすでに欧州や、日本国内の通信事業者や自動車メーカーともパートナーシップの提携に向けたディスカッションを始めているという。
《山本 敦》

関連ニュース

特集

page top