NEC、音声だけでテキスト装飾されたブログが投稿可能な技術を開発 | RBB TODAY

NEC、音声だけでテキスト装飾されたブログが投稿可能な技術を開発

エンタープライズ その他

「聞いて見て楽しいブログ」
  • 「聞いて見て楽しいブログ」
 NECは6日、文章のテキストデータから筆者の気持ちを推定することで、ポジティブな気持ち/ネガティブな気持ちに合わせた音声合成による楽しい読み上げや、多様な文字飾りなど、エンターテインメント性を高めたコンテンツを自動生成できる技術を発表した。

 この技術は、テキストデータを解析し、各文に込められた筆者の気持ちがポジティブかネガティブかを推定する「マインド判定技術」、解析した気持ちに合わせ、合成音声の特性(トーン)を多様に変更できる「可変トーン音声合成技術」を組み合わせたもの。

 「マインド判定技術」では、NECが従来から開発している、「高い」「小さい」のような文章中の評価表現の評価対象を特定できる評判抽出技術を応用し、評価表現を含む文に込められた筆者の気持ちがポジティブかネガティブかを判定。「楽しい」「悔しい」などの直接感情を表す語句が含まれた文章からだけでなく、これらの語句が文章に含まれていない場合でも、評価表現と評価対象をもとに筆者の気持ちを推定できる。「可変トーン音声合成技術」では、読み上げの速さ、声の高さや太さ、明るさなど、話者の特性(トーン)を表すさまざまなパラメータを大きく変更しても、滑らかな音声を合成できる技術を開発。マインド判定技術によって筆者の気持ちが判定された各文章を、パラメータを組み合わせた特徴的な音声を切り替えて読み上げることで、楽しい文章読み上げを実現した。

 さらに、今回開発された技術を利用して、携帯電話から音声メッセージと写真をメールで送信するだけで、特徴的な音声合成による楽しい読み上げや、豊かな文字飾り付けなど、多彩な表現で「聞いて見て楽しいブログ」を作成可能なシステムを開発した。携帯電話から投稿されたブログ用音声メッセージを音声認識技術によりテキストデータへ変換し、テキストデータ中のブログ筆者の気持ちをマインド判定技術により推定、さらに推定した気持ちをもとにテキストデータを読み上げる音声の特性や、テキストの文字色/サイズ、挿入する絵文字を自動設定する。NECでは、携帯電話からのブログ投稿だけでなく、表現力やエンターテインメント性の高いコンテンツを必要とするさまざまなサービスに展開を予定している。
《冨岡晶》

関連ニュース

特集

page top