今度の合成音声はナレーション! 〜 富士通研、人間の声に迫る自然な音声合成の技術を開発

2009年7月27日(月) 17時04分
音声合成の利用シーンの広がりの画像
音声合成の利用シーンの広がり
開発された音声合成技術の概要の画像
開発された音声合成技術の概要
 富士通研究所は27日、人間の声に迫る、きわめて自然な音声を合成できる音声合成技術を開発したと発表した。本技術による合成音声は、音声品質の評価方法であるCMOS(Comparison Mean Opinion Score)評価において、プロのナレーション品質の80%に迫る、業界最高クラスの高いスコアを達成したという。

 従来の合成音声は、プロのナレータの音声に対して不自然さが感じられ、放送やアナウンスなどプロのナレーターの代替として十分に利用されていなかった。人が文章を読み上げる際、いくつかの音が自然にまとまり、無意識のうちに日本語独特のリズム(発話リズム)で発声されている。音声合成で人間らしい流暢な語り口を実現するためには、このような発話リズムを適切に制御することが必要だった。また、どんな文章の入力に対しても最適な音声波形を用意できる音声波形データベースを開発することが課題とされていた。

 今回富士通研では、独自の発話リズム制御モデルと音声波形データベースを開発し、きわめて自然で人間の声に迫る高品質な音声合成技術を実現した。人間らしい流暢な音声を実現させるために、人間の発話リズムを解析するためのあらたな統計手法を開発し、独自の発話リズム制御モデルを構築したという。これにより、各音の長さについて、肉声との差を従来の3分の2(富士通研究所比)に抑え、1つ1つの音の長さのバランスがとれた、流暢な読み上げ音声を実現した。さらに、さまざまなイントネーションを網羅し、かつ使用頻度の高い単語や文例を中心とした、従来の約10倍(富士通研究所比)となる数万個ものフレーズからなる大規模音声波形データベースを構築。本データベースを用いることで、合成文章に適した音声波形を選択でき、各単語間のつながりなど、機械的な歪みのない合成音声が生成できるようになったとのこと。

 この音声合成技術により、放送コンテンツや各種アナウンス、e-Learning教材用音声など、従来ナレーターが担ってきた分野において、低コストな合成音声での代替が可能になる見込みだ。富士通研究所は、各種利用シーンに対して迅速な適用を可能にするための機能強化を図り、2009年度上期中の実用化を目指すとのこと。
《池本淳》
注目の情報[PR]

注目ニュース

富士通研、携帯電話用OSで利用可能なIP電話基盤技術を世界で初めて開発 〜 Symbian OS、Androidなどに対応

 富士通研究所は6日、Symbian OS、Windows Mobile、Androidの各OS上で共通に利用できる、IP電話基盤技術の開発に世界で初めて成功したと発表した。

「シャングリ・ラ」の北条國子を思い通りにしゃべらせてみよう!

 BIGLOBEのキャラクター音声合成サイト「コエラボ」にて、現在テレビ放送中の人気アニメ「シャングリ・ラ」のキャラクター「北条國子」の音声を自由に作成できるサービスがスタートした。

【富士通フォーラム(Vol.1)ビデオニュース】タッチ感覚で認証!手のひら静脈認証の高速撮影技術!

 富士通のプライベートイベント「富士通フォーラム 2009」が14日に開幕する。12日には関係者を対象に会場がオープンしたため、さっそく主なデモや展示内容を紹介していこう。

富士通とウィルコム、電源オフでも遠隔操作できるノートPCの紛失・盗難対策ソリューションを開発

 富士通、富士通研究所、ウィルコムは7日、法人顧客を対象に、ウィルコムのPHSネットワークを利用した新たなノートPC向けセキュリティソリューションを開発したと発表した。

富士通ME、HD映像の伝送が可能な「1394 Automotive」規格準拠LSIを新発売

 富士通マイクロエレクトロニクスは22日、情報系車載ネットワークの国際規格「1394 Automotive(IDB-1394)」に準拠したコントローラーLSI「MB88395」のサンプル出荷を開始した...

口コミや声優情報も〜アニメポータル「アニメワン」オープン

 BIGLOBEは、4月9日よりアニメ作品に関するさまざまな情報を提供するアニメポータルサイト「アニメワン」を開設。アニメ動画配信や関連グッズ販売などを行っている。

NEC、音声だけでテキスト装飾されたブログが投稿可能な技術を開発

 NECは6日、文章のテキストデータから筆者の気持ちを推定することで、気持ちに合わせた音声合成による楽しい読み上げや、多様な文字飾りなど施されたコンテンツを自動生成できる技術を発表した。

テキストを書くだけで映像ができる「T2Vプレイヤー」、IRIが無償提供

 インターネット総合研究所(IRI)は10日、T2Vプレイヤー Version1.0β(以下、T2Vプレイヤー)をリリースし、Webサイトにて無償提供を開始した。

富士通、札幌市ユビキタス特区でのLTEフィールド実証実験を実施 〜 光回線の2.5倍速を計測

 富士通および富士通研究所は16日、ユビキタス特区札幌市地域において、高速大容量無線通信を実現する基幹技術である4×4 MIMOを用いたLTEフィールド実証実験を、ドコモと共同実施したことを発表した。

富士通研、宛先ミスから機密情報流出まで対策が可能な、メール情報漏洩対策技術を開発

 富士通研究所は13日、メールからの情報漏洩対策として、宛先ミスから機密情報の流出防止まで対応するメール誤送信対策技術を開発したと発表した。

東芝、富士通からのHDD事業譲渡に基本合意

 東芝と富士通は17日、東芝が富士通のハードディスクドライブ(HDD)事業を譲り受けることで基本合意したことを発表した。

富士通研、ブレードサーバの高速化を実現する多チャネル高速送受信回路を開発

 富士通研究所とFLA, Inc.は12日、サーバを複数組み合わせて高性能化するブレードサーバの通信経路として利用されるバックプレーンにおいて、毎秒10Gbpsでの伝送を実現する、低消費電力・小型な多...

富士通、国際標準化団体TCGの新仕様に対応したHDDセキュリティ技術を開発

 富士通と富士通研究所は28日、セキュリティ技術の向上を目的とした国際標準化団体「Trusted Computing Group」(TCG)による新仕様に対応した、暗号化機能搭載2.5型ハードディスク...

人気ホラーアニメ「地獄少女」でユーザー参加型ネットラジオ

 みんなで作った音声でネットラジオ。BIGLOBEは、音声合成サービス「コエラボ(KoeLabo)」の合成音声を使って制作されたインターネットラジオ番組「地獄ラヂオ」の公開を開始した。

【MS Car Navigation Day Vol.7】Embedded CEによるPND開発——富士通ソフトウェアテクノロジーズ

 「Windows Embedded NavReadyの紹介」に続き、富士通ソフトウェアテクノロジーズの杉本拓也氏は、Windows Embedded CEによるPND開発の実際について説明した。

富士通、2.5型HDD「MHZ2 CJ」シリーズがJIS X 19790セキュリティ認証を取得

 富士通と富士通研究所は4日、2008年4月に発表した暗号化機能搭載2.5型HDD「MHZ2 CJ」シリーズが、ハードディスクとしては初めて「JIS X 19790」に基づくセキュリティ認証を取得した...

富士通研、C帯で世界最高出力320Wの高出力・高効率増幅器を開発〜窒化ガリウムHEMTを採用

 富士通研究所は21日、窒化ガリウム(GaN)高電子移動度トランジスタ(HEMT:High Electron Mobility Transistor)を用いて、C帯(4GHz〜8GHzの周波数帯)で3...

富士通、待機時の通電の遮断と100W超の高出力性能を両立した窒化ガリウムHEMT

 富士通と富士通研究所は10日、マイクロ波帯〜ミリ波帯の送信用増幅器に適した新構造の窒化ガリウム高電子移動度トランジスタ(HEMT)を発表した。

元気モバイルとアルカディア、Android用音声認識・音声合成向けミドルウェアを共同開発

 元気モバイルとアルカディア7日、携帯電話用ソフトウェアプラットフォーム「Android」に向け、音声認識・音声合成機能を組み合わせたミドルウェアを共同開発することを発表した。

KDDI研究所、携帯電話で動作するなめらかで自然性が高い日本語音声合成ソフトウェアを試作

 KDDI研究所は19日、名古屋工業大学徳田恵一教授との共同研究により、携帯電話端末で動作可能な日本語音声合成技術を開発し、ダウンロードにより複数の声質での音声合成機能を携帯電話端末に追加するソフトウ...

富士通、現場情報や人やモノの単位にID情報を格納する新技術

 富士通研究所は16日、センサーなどのさまざまなユビキタス機器から収集される現場の情報を、人やモノといったIDの単位に関係づけて体系的に利用可能とするID情報の格納技術を発表した。

ボイスギアスを手に入れろ! ゼロもC.C.も思いのまま

 コードギアス製作委員会とNECビッグローブは、人気アニメ「コードギアス 反逆のルルーシュ R2」のキャラクターの音声をネット上で利用者が自由に作成できる音声合成サービスを開始した。

ターミネーターの声まね機能もこれで実現? OKI、音声合成ソフトウェア「Polluxstar」

 咽頭癌などで声帯を摘出する予定の人には朗報だ。OKIは24日、自分の声で音声合成ができるソフトウェア「Polluxstar(ポルックスター)」を本日から提供開始する。

富士通研、ビデオの証拠能力を高める映像証跡技術——抽出画像の改ざんも検出

 富士通研究所は3日に、長時間撮影されたデジタル映像データにおいて、分割して保存・管理したり、一部を切り出した場合でも、その映像がもとの映像の一部であり、改ざんがないことや撮影された時刻の確認を可能に...

富士通、インパルス無線伝送方式で70〜100GHz帯パルス送信器の開発に成功

 富士通と富士通研究所は19日、インパルス無線伝送方式に基づく70〜100GHz帯送信器の開発に世界で初めて成功したことを発表した。

富士通、大幅な低消費電力化・小型化を実現したモバイルWiMAX端末向けチップセット

 富士通マイクロエレクトロニクスは16日、モバイル端末向けモバイルWiMAX小型モジュールに最適化したチップセットを開発した。サンプル価格はセットで8,000円。8月よりサンプル出荷を開始する。

富士通研、同時に複数の人を追跡する画像センシング技術の開発に成功

 富士通研究所は13日に、部屋の中にいる人を漏れなく追跡する業界初の画像センシング技術を発表した。

滋賀銀行、富士通製ビジネス情報ナビを導入〜地域ビジネスの相関図を自動で「見える化」

 富士通は7日、滋賀銀行におけるビジネス情報ナビゲーションシステムを構築したことを発表した。

富士通研究所、先端LSIのソフトエラー発生率を短期間で高精度に測定する技術を開発

 富士通研究所は30日、国立天文台ハワイ観測所と共同で宇宙線の一種である中性子線によって引き起こされる先端LSIの誤動作、ソフトエラーの利用現場における発生率を短期間で高精度に測定する技術を確立した。

RSS

特集・連載

ブロードバンド/無線LANスポット検索

ブロードバンド検索
-

ピックアップフォト