KDDI研究所、携帯電話で動作するなめらかで自然性が高い日本語音声合成ソフトウェアを試作
ブロードバンド
その他
-
コスパ最強の“手のひらサイズ”ミニPC「GT13 Pro 2025 Edition」「A5 2025 Edition」がGEEKOMから登場!
-
KDDI研究所、独自の超高速秘密分散方式で秘密情報を保護する管理システムを開発
-
KDDI研、IPネットワーク経由で視聴する「ワンセグエリア放送送信システム」を開発
今回開発された日本語音声合成技術は、音声波形の断片をそのまま利用するのではなく、音声波形の特徴をHMM(隠れマルコフモデル)により効率的に表すことで、元のナレータの声質や話し方も再現する音声の高品質合成に必要な情報を、携帯電話で扱える1MB程度のデータサイズにまで圧縮したもの。音がなめらかで自然性が高いほか、ナレータの音声波形データから、その声質・話し方での音声合成に必要なデータを作成するまでの処理のほとんどが自動化されているため、制作コストが抑えられるのが特徴だ。
携帯電話向けソフトウェアは、この音声合成技術を携帯電話端末で動作するレベルまで高速化したもの。これにより、さまざまなナレータ・声優の中から好みの声を選んでダウンロードし、メールやブログを読み上げるサービスや小説を登場人物ごとに別の声で読み上げるサービスなどが実現する。
今後は、大規模な受聴試験を行いながら、合成音声の自然性をさらに高めていくとしている。
関連ニュース
-
KDDI研究所、独自の超高速秘密分散方式で秘密情報を保護する管理システムを開発
-
KDDI研、IPネットワーク経由で視聴する「ワンセグエリア放送送信システム」を開発
-
テレビ電話・顔認証・タッチパネル端末で特定保健指導業務を支援——KDDI研
-
映像がなくても“選手や審判の視点”が可能に〜KDDI研究所、「自由視点映像VODシステム」を開発
-
KDDI研究所、新OFDM方式「R-OFDM」の開発に成功〜安定した高速モバイル通信が可能に
-
KDDI研究所、光OFDMを利用した100Gbps信号の長距離伝送実験に成功
-
KDDI研、MPEG-2とH.264をシームレスに混在させて配信する技術を開発〜次世代番組配信で活用
-
総務省、NGN標準化テストベッドでの日中韓共同実験を開始
-
総務省、「ユビキタス特区」第2次プロジェクトを決定〜新ワンセグの開発などあらたに6件を追加
-
情報通信研究所、KDDI研究所ら、総務省施策「ユビキタスITS」の研究成果の実証実験を実施
-
コグニティブ無線端末機など、移動通信に関する最先端技術を実証実験で公開〜横須賀リサーチパーク
-
TVバンク、P2P技術をベースとした動画配信システムで、JANOG21ミーティングをライブ中継
-
KDDI、公開実験アプリをバージョンアップ、任意の画像から隠し絵の作成が可能に
-
KDDI研究所とメディアキャスト、ワンセグ対応H.264エンコーダを共同開発〜コストダウンと高品質化を実現