【Wireless Japan 2011(Vol.3)】夢の通訳電話が実現に近づいた!ひと味違うキャリア発近未来技術 | RBB TODAY

【Wireless Japan 2011(Vol.3)】夢の通訳電話が実現に近づいた!ひと味違うキャリア発近未来技術

ブロードバンド テクノロジー

NTTドコモ 研究開発センター ネットワーク開発部ネットワーク方式担当主査 佐藤篤氏
  • NTTドコモ 研究開発センター ネットワーク開発部ネットワーク方式担当主査 佐藤篤氏
  • 通訳電話用アプリケーション。あらかじめ端末側にインストールしておく。通話者同士の会話内容をテキストで表示させ、確認する目的でつくられたもの
  • 音声と同時にテキストも表示される。
  • 通訳電話の原理。2台の電話はネットワーク上のサーバでつながれる形。実際にはサーバから2つの端末に回線交換で電話がつながる「カンファレンス・ブリッジ」が仲介するようなイメージ。音声は、サーバ側の音声認識機能でテキスト化され、翻訳エンジンで翻訳。それらを音声合成で発話して、相手側に伝える仕組みだ
  • 実は、この技術は特に通訳でなくてもよいのだ。話し言葉の意味を理解できるため、ネットワーク・クラウドの組み合せにより、様々な“専門家”が要望に応えてくれるようなサービスを実現できるようになるという
 2月にスペインで開催された「Mobile World Congress 2011」で、NTTドコモ 代表取締役社長 山田隆持氏がアナウンスした「通訳電話」。「Wireless Japan 2011」ではその一端が公開される。実現に近づいたNTTドコモの「通訳電話」技術と展示会の見どころについて紹介しよう。

 同技術は参考出展だが、注目株の1つとしてテレコムの将来像を予感させる。これまでもスマートフォン用の翻訳アプリケーションはAndroidやiOS用でもあった。しかしNTTドコモが開発した通訳電話は、このようなツールとは一線を画する、まさにキャリアならではの「通訳電話」技術だ。

 基本的に通訳電話であるため、端末双方の間では普通に電話ができる状態になっている。電話自体は携帯電話の3G回線を利用するのだが、たとえば日本語と英語というように、それぞれの相手が異なる言語で自由に会話を行っても、あたかも間に通訳を介しているかのように音声合成で発話された言葉を返してくれる。NTTドコモ 研究開発センタの佐藤篤氏(ネットワーク開発部)は「いわゆる翻訳ツールとは根本的に違うものです。我々の通訳電話は、話しかける相手が実際に存在しており、その相手がまさに発した言葉を通訳してもう一方の相手側に届けられるもの」と胸を張る。

 2台の電話はネットワーク上のサーバでつながれた形になっている。実際にはサーバと2台の端末間の電話を「カンファレンス・ブリッジ」で仲介するようなイメージだ。ユーザー側で発信して、その呼によって、センターでフックして着信するわけだ。そして音声は、サーバ側の音声認識機能によって一旦テキスト化され、それを日本語←→英語という具合に翻訳エンジンで翻訳。さらに翻訳されたテキストが音声合成機能によって音声として発話され、電話回線経由で相手側に伝わる。現時点では英語のみの通訳だが、今後、中国語、韓国語の通訳も検討中だ。

 精度も簡単な日常会話程度の会話ならば、ほぼ正確だ。取材時のデモでは「京都観光をしたいのですが、東京から京都までどのくらいかかりますか?」という会話を通訳して相手に発話し、「新幹線で2時間半ぐらいかかります」というような一連の返事を意味の通る形でうまく通訳して返していた。またニュースのような長い文章でも、きれいな発音で文法がしっかりしていれば、ほぼ正確な通訳ができる点も特徴の1つだ。「語尾など曖昧な発声では、まだ若干の間違いもあるが、厳密な形ではなく、肉声によるコミュニケーションが取れて、その意味を通訳で添えてくれるサービスという観点でいえば、現行レベルでも使ってもらえるだろう」(佐藤氏)と語る。

 オプションだが、スマートフォンでは通訳電話用のアプリケーションをあらかじめインストールすることも可能である。これはサーバ側で音声を認識し、エンジンで翻訳した結果が実際にどのようになっているのか、通話者同士の会話内容をテキストで表示させ、それを確認する目的でつくられたものだという。このように同技術は、電話とネットワーク・クラウドを組み合わせることによって、ホームステイ先の家族に挨拶するなど、海外における言語の壁を容易に越えるコミュニケーションを実現できる。しかし、NTTドコモは単なる通訳だけが利用シーンではないと考えているそうだ。「話し言葉の意味を理解できるため、ネットワーク・クラウドとの組み合わせによって、会話の流れの中で様々な“専門家”が要望に応えてくれるようなサービスになることが期待できます。“専門家”は、通訳であったり、スケジュール担当であったり、グルメガイドであったり、天気予報士であったりと、基本的には何でもよいのです」(佐藤氏)という。

 このように将来的には、通話という音声会話において、何らかの付加機能を追加することで、さまざまな分野でサービス向上が図れるようになるはずだ。たとえばスケジューラのWebアプリケーションと連動させて、外出先での訪問日時のスケジュール調整を行ってくれたり、訪問先の情報の検索・共有などにも使えるようになるだろう。このほか音声という側面から、声色を判断して感情や健康を分析したり、自分で英語を話して発音をチェックしたりするなど学習・教育分野でも応用が利くかもしれない。

 展示会場では、このようなデモを来場者が体験できるブースを用意する。また、プロのMC・ナレータによるステージ上での技術紹介や、講演会などの予定もある。単なる通訳だけでは終わらない、ワクワク・ドキドキするような未来志向の感動を味わえるはずだ。
《RBB TODAY》

関連ニュース

特集

page top