【木暮祐一のモバイルウォッチ】第4回「スマートフォンが会話の相手に、そして生活の指南役になる時代へ!」 | RBB TODAY

【木暮祐一のモバイルウォッチ】第4回「スマートフォンが会話の相手に、そして生活の指南役になる時代へ!」

 このところ、アップルによるiPhoneの「Siri」や、NTTドコモの「しゃべってコンシェル」を宣伝するテレビコマーシャルをよく見かける。

エンタープライズ モバイルBIZ
木暮祐一氏。武蔵野学院大学准教授で携帯電話研究家/博士(工学)
  • 木暮祐一氏。武蔵野学院大学准教授で携帯電話研究家/博士(工学)
  • iPhoneのSiriに時間を尋ねてみた。
  • 会話の感覚で話しかけるだけで、色々な情報を返してくれる。
  • しゃべってコンシェルで、今ある素材と、最後に「レシピ」と話しかければ、クックパッドの検索結果を返してくれる。
  • 悩みや相談にも暖かい言葉を返してくれるのがしゃべってコンシェルだ。
  • しゃべってコンシェルでは「耳あて自動音声入力」をONにすることで、通話スタイルで音声入力が可能。
 このところ、アップルによるiPhoneの「Siri」や、NTTドコモの「しゃべってコンシェル」を宣伝するテレビコマーシャルをよく見かける。まるで両社がお互いを意識して火花を散らしているような様相だ。いずれも、スマートフォンに「話しかける」ことで、端末機能を利用したり必要とする情報を検索できる「音声エージェント」機能およびサービスである。

 音声による検索機能に関しては以前からGoogleも力を入れており、Android OSを搭載したスマートフォンではVoice Searchという機能を利用し音声入力で検索することができた。さらに6月28日に米国サンフランシスコで開催された開発者向けのイベント「Google I/O 2012」では、次期Android OSであるAndroid 4.1を発表した。この基調講演の中でGoogleは、Voice Searchがさらに進化し、Siriやしゃべってコンシェルをかなり意識した「音声エージェント」に発展していくということを示している。Android 4.1のVoice Searchの日本語対応も待ち遠しいところだ。

 では、すでに日本語で利用可能な「Siri」「しゃべってコンシェル」について見ていきたい。

 Siriは、iPhone 4Sに搭載された音声エージェント機能である。昨年秋にiPhone 4Sが発売開始された際にはまだ日本語が対応していなかったため、わが国ではあまり話題にされなかった。しかし本年3月にiOSが5.1にアップデートされた際にSiriが日本語にも対応したことで改めて注目されるようになった。いっぽう、NTTドコモのしゃべってコンシェルも、Siri日本語版と時を同じくして本年3月1日から提供を開始したサービスである。NTTドコモの場合はこの音声エージェント機能をアプリとして提供し、NTTドコモが販売したスマートフォンの多数の機種上で利用できるという点で、対応機種が幅広いのが優位点。Siriが端末限定のサービスなのに対し、しゃべってコンシェルはNTTドコモのスマートフォンを利用している多くのユーザーに裾野を広げている。

 「iPhone 4Sの発表以後、NTTドコモが慌ててしゃべってコンシェルを開発したのでは?」などという憶測も一時飛び交ったが、じつはNTTドコモはかなり以前からこうしたエージェント系サービスの実現に向け、研究開発に取り組んできていた。実際には2000年代前半のiモード隆盛期にはすでに音声を活用したエージェント機能の構想を持っていたようだ。「アラジンの魔法のランプ(話かければ何でもしてくれる)を実現させることがミッションである」とはよく関係者から聞かされてきた話であるし、その構想を実現させた第一歩がフィーチャーフォン向けに開始された「iコンシェル」といわれている。

 また昨年春にNTTドコモの研究開発部門を取材させていただいた際に、力を入れているなと感じたのが「翻訳電話」(現在、一部試験提供中)などの音声を使ったコミュニケーションサービスだった。そもそも「電話」は音声でコミュニケーションする道具として、100年を遥かに超える歴史を誇っているわけで、そうした電話サービスを原点としてきた通信会社であるNTTドコモとしては、様々なデータ通信系サービスももちろん重要には違いないが、サービスの根底には「音声」によるコミュニケーションこそ究極のものであるという認識に立ってサービスを模索しているに違いない。

 「Siri」「しゃべってコンシェル」も、音声を一旦ネットワークにアップロードして分析し、最適な結果を返すというクラウド型のサービスとなっている。SiriはiPhone 4S専用の機能として備えられており、このため端末内蔵の各種機能との連携は優れている。たとえば、音声でアラームやリマインダなどを操作できる。メール(SMS等)の作成はもとより、読上げなどにも対応している。しゃべってコンシェルもソフトウェア的にタイマー機能を備えたり、その他のアプリとの連携を図るなどの工夫はしているが、端末内機能と連携させた使い方でのスムースさという面では、Siriが若干有利に思われる。

 一方、様々なインターネット上のコンテンツサービスと連携し、検索結果を導き出してくるような使い方ではしゃべってコンシェルに軍配があがる。じつは日本語版のSiriはまだベータサービスとしており、情報検索には十分に対応できていない(米国版では、情報検索が可能である)。一方の「しゃべってコンシェル」は、日本でのサービス提供を前提に日本で開発されたサービスだけあって、「日本語の話し言葉」を解析していかにユーザーの意図を汲み取るのかという点で、きめの細やかさが優れているように感じるのである。また、いずれのサービスも使い込んでいくと「人間味」を感じるようになるが、Siriはいかにも「アメリカ的な秘書」という感じの「切り返しがうまいなと思えるクールな回答」が多いが、しゃべってコンシェルの場合はとても「日本人的な謙虚さ」を感じてくる。たとえば、「好きだ!」と話しかけると、Siriは「ありえないわ」「他のApple製品にも同じことを言っているでしょ?」というクールでユーモアある回答が返ってくるが、しゃべってコンシェルの場合は「もったいないお言葉です」と謙遜してくる。

 さらにしゃべってコンシェルは6月のバージョンアップで、豊富な情報系モバイルコンテンツをデータベースとして有効に活用し、ユーザーの求めている質問により適切に答えるようになった。たとえば、「東京スカイツリーの高さは?」と聞けば「634メートル」と返してくる。日本の有名人などにも対応しているようで、「浅田真央の出身地は?」と聞けば「愛知県です。」と回答してくれる。また、レシピ検索で有名なクックパッドとの提携し、たとえば「にんじん」「じゃがいも」「豚肉」「レシピ」と話かけることで、その素材を活用したレシピ検索が可能になっている。

 そもそも人前で声を張り上げるのが苦手な日本人だけに、こうした声を出さなくてはならないサービスはヒットしないのではと言われてきた。このあたりもNTTドコモは細かい配慮が行き届いている。しゃべってコンシェルのアプリ設定の中に「耳あて自動音声入力」という設定項目が備えられている。これをONにすると、通話しているようなスタイルで音声入力をすることができる。ディスプレイ面に備えられた近接センサーでスマートフォンが通話スタイルになったことを関知し、それでしゃべってコンシェルのマイクがONになる。

 これら音声エージェントサービスは、今後のスマートフォンにおけるキラーサービスになって行くのではないかと筆者は予想している。スマートフォンが「秘書」になるという構想の実現は分かりやすいが、それ以上に様々な目的で「スマートフォンに話かける」機会は今後増えていくと想定されている。

 たとえば韓国では今春、Android OSを搭載した子ども用スマート教育ロボット「kibot2」が発売開始されている。日本ではスマートフォンというと電話機の延長という発想しか出てこないが、韓国ではロボット型のスマートフォンが登場したと考えると分かりやすい。顔の部分がタッチパネル式ディスプレイになっていて、ここを操作して子どもたちが様々な教育コンテンツに触れたり、IPテレビ電話機能などを利用しコミュニケーションを図ることができる。まだこのロボットには音声エージェント機能まで備えられていなかったようだが、いずれ話しかけて会話が成立するようなものに発展していくであろう。

 こうしたスマートロボットが、もしわが国でも開発されるようになれば、たとえば独居高齢者向けに本領を発揮するものになるかもしれない。高齢者の家庭に配備され、高齢者の話し相手になることはもちろん、簡単な音声操作で情報検索したり、商品を購入し配達してもらうといった使い方が想定される。さらに高齢者が発する音声から、健康状態を判断して必要なケアサービスを提供するといったアシスト機能を備えることも考えられる。このように考えると、私たちの「音声」は、最も基本的なコミュニケーション手段である上に、私たちの心や体の状態を読み取る重要な「情報」源になりうるものだ。そして、こうした情報が蓄積されるていったデータを解析した上で、統計的な情報を元に適切な健康に関する情報提供ができるであろうし、さらなる健康的な生活を実現させるための助言もできるような指南役に発展できるかもしれない。
《RBB TODAY》

関連ニュース

特集

page top