今度の合成音声はナレーション! 〜 富士通研、人間の声に迫る自然な音声合成の技術を開発
エンタープライズ
その他
-
コスパ最強の“手のひらサイズ”ミニPC「GT13 Pro 2025 Edition」「A5 2025 Edition」がGEEKOMから登場!
-
富士通研、携帯電話用OSで利用可能なIP電話基盤技術を世界で初めて開発 〜 Symbian OS、Androidなどに対応
-
「シャングリ・ラ」の北条國子を思い通りにしゃべらせてみよう!
従来の合成音声は、プロのナレータの音声に対して不自然さが感じられ、放送やアナウンスなどプロのナレーターの代替として十分に利用されていなかった。人が文章を読み上げる際、いくつかの音が自然にまとまり、無意識のうちに日本語独特のリズム(発話リズム)で発声されている。音声合成で人間らしい流暢な語り口を実現するためには、このような発話リズムを適切に制御することが必要だった。また、どんな文章の入力に対しても最適な音声波形を用意できる音声波形データベースを開発することが課題とされていた。
今回富士通研では、独自の発話リズム制御モデルと音声波形データベースを開発し、きわめて自然で人間の声に迫る高品質な音声合成技術を実現した。人間らしい流暢な音声を実現させるために、人間の発話リズムを解析するためのあらたな統計手法を開発し、独自の発話リズム制御モデルを構築したという。これにより、各音の長さについて、肉声との差を従来の3分の2(富士通研究所比)に抑え、1つ1つの音の長さのバランスがとれた、流暢な読み上げ音声を実現した。さらに、さまざまなイントネーションを網羅し、かつ使用頻度の高い単語や文例を中心とした、従来の約10倍(富士通研究所比)となる数万個ものフレーズからなる大規模音声波形データベースを構築。本データベースを用いることで、合成文章に適した音声波形を選択でき、各単語間のつながりなど、機械的な歪みのない合成音声が生成できるようになったとのこと。
この音声合成技術により、放送コンテンツや各種アナウンス、e-Learning教材用音声など、従来ナレーターが担ってきた分野において、低コストな合成音声での代替が可能になる見込みだ。富士通研究所は、各種利用シーンに対して迅速な適用を可能にするための機能強化を図り、2009年度上期中の実用化を目指すとのこと。
関連リンク
関連ニュース
-
富士通研、携帯電話用OSで利用可能なIP電話基盤技術を世界で初めて開発 〜 Symbian OS、Androidなどに対応
-
「シャングリ・ラ」の北条國子を思い通りにしゃべらせてみよう!
-
【富士通フォーラム(Vol.1)ビデオニュース】タッチ感覚で認証!手のひら静脈認証の高速撮影技術!
-
富士通とウィルコム、電源オフでも遠隔操作できるノートPCの紛失・盗難対策ソリューションを開発
-
富士通ME、HD映像の伝送が可能な「1394 Automotive」規格準拠LSIを新発売
-
口コミや声優情報も〜アニメポータル「アニメワン」オープン
-
NEC、音声だけでテキスト装飾されたブログが投稿可能な技術を開発
-
テキストを書くだけで映像ができる「T2Vプレイヤー」、IRIが無償提供
-
富士通、札幌市ユビキタス特区でのLTEフィールド実証実験を実施 〜 光回線の2.5倍速を計測
-
富士通研、宛先ミスから機密情報流出まで対策が可能な、メール情報漏洩対策技術を開発
-
東芝、富士通からのHDD事業譲渡に基本合意
-
富士通研、ブレードサーバの高速化を実現する多チャネル高速送受信回路を開発
-
富士通、国際標準化団体TCGの新仕様に対応したHDDセキュリティ技術を開発
-
人気ホラーアニメ「地獄少女」でユーザー参加型ネットラジオ
-
【MS Car Navigation Day Vol.7】Embedded CEによるPND開発——富士通ソフトウェアテクノロジーズ
-
富士通、2.5型HDD「MHZ2 CJ」シリーズがJIS X 19790セキュリティ認証を取得
-
富士通研、C帯で世界最高出力320Wの高出力・高効率増幅器を開発〜窒化ガリウムHEMTを採用
-
富士通、待機時の通電の遮断と100W超の高出力性能を両立した窒化ガリウムHEMT
-
元気モバイルとアルカディア、Android用音声認識・音声合成向けミドルウェアを共同開発
-
KDDI研究所、携帯電話で動作するなめらかで自然性が高い日本語音声合成ソフトウェアを試作
-
富士通、現場情報や人やモノの単位にID情報を格納する新技術