今度の合成音声はナレーション! 〜 富士通研、人間の声に迫る自然な音声合成の技術を開発
従来の合成音声は、プロのナレータの音声に対して不自然さが感じられ、放送やアナウンスなどプロのナレーターの代替として十分に利用されていなかった。人が文章を読み上げる際、いくつかの音が自然にまとまり、無意識のうちに日本語独特のリズム(発話リズム)で発声されている。音声合成で人間らしい流暢な語り口を実現するためには、このような発話リズムを適切に制御することが必要だった。また、どんな文章の入力に対しても最適な音声波形を用意できる音声波形データベースを開発することが課題とされていた。
今回富士通研では、独自の発話リズム制御モデルと音声波形データベースを開発し、きわめて自然で人間の声に迫る高品質な音声合成技術を実現した。人間らしい流暢な音声を実現させるために、人間の発話リズムを解析するためのあらたな統計手法を開発し、独自の発話リズム制御モデルを構築したという。これにより、各音の長さについて、肉声との差を従来の3分の2(富士通研究所比)に抑え、1つ1つの音の長さのバランスがとれた、流暢な読み上げ音声を実現した。さらに、さまざまなイントネーションを網羅し、かつ使用頻度の高い単語や文例を中心とした、従来の約10倍(富士通研究所比)となる数万個ものフレーズからなる大規模音声波形データベースを構築。本データベースを用いることで、合成文章に適した音声波形を選択でき、各単語間のつながりなど、機械的な歪みのない合成音声が生成できるようになったとのこと。
この音声合成技術により、放送コンテンツや各種アナウンス、e-Learning教材用音声など、従来ナレーターが担ってきた分野において、低コストな合成音声での代替が可能になる見込みだ。富士通研究所は、各種利用シーンに対して迅速な適用を可能にするための機能強化を図り、2009年度上期中の実用化を目指すとのこと。
注目ニュース
富士通研究所は6日、Symbian OS、Windows Mobile、Androidの各OS上で共通に利用できる、IP電話基盤技術の開発に世界で初めて成功したと発表した。
BIGLOBEのキャラクター音声合成サイト「コエラボ」にて、現在テレビ放送中の人気アニメ「シャングリ・ラ」のキャラクター「北条國子」の音声を自由に作成できるサービスがスタートした。
富士通のプライベートイベント「富士通フォーラム 2009」が14日に開幕する。12日には関係者を対象に会場がオープンしたため、さっそく主なデモや展示内容を紹介していこう。
富士通、富士通研究所、ウィルコムは7日、法人顧客を対象に、ウィルコムのPHSネットワークを利用した新たなノートPC向けセキュリティソリューションを開発したと発表した。
富士通マイクロエレクトロニクスは22日、情報系車載ネットワークの国際規格「1394 Automotive(IDB-1394)」に準拠したコントローラーLSI「MB88395」のサンプル出荷を開始した...
BIGLOBEは、4月9日よりアニメ作品に関するさまざまな情報を提供するアニメポータルサイト「アニメワン」を開設。アニメ動画配信や関連グッズ販売などを行っている。
NECは6日、文章のテキストデータから筆者の気持ちを推定することで、気持ちに合わせた音声合成による楽しい読み上げや、多様な文字飾りなど施されたコンテンツを自動生成できる技術を発表した。
インターネット総合研究所(IRI)は10日、T2Vプレイヤー Version1.0β(以下、T2Vプレイヤー)をリリースし、Webサイトにて無償提供を開始した。
富士通および富士通研究所は16日、ユビキタス特区札幌市地域において、高速大容量無線通信を実現する基幹技術である4×4 MIMOを用いたLTEフィールド実証実験を、ドコモと共同実施したことを発表した。
富士通研究所は13日、メールからの情報漏洩対策として、宛先ミスから機密情報の流出防止まで対応するメール誤送信対策技術を開発したと発表した。
東芝と富士通は17日、東芝が富士通のハードディスクドライブ(HDD)事業を譲り受けることで基本合意したことを発表した。
富士通研究所とFLA, Inc.は12日、サーバを複数組み合わせて高性能化するブレードサーバの通信経路として利用されるバックプレーンにおいて、毎秒10Gbpsでの伝送を実現する、低消費電力・小型な多...
富士通と富士通研究所は28日、セキュリティ技術の向上を目的とした国際標準化団体「Trusted Computing Group」(TCG)による新仕様に対応した、暗号化機能搭載2.5型ハードディスク...
みんなで作った音声でネットラジオ。BIGLOBEは、音声合成サービス「コエラボ(KoeLabo)」の合成音声を使って制作されたインターネットラジオ番組「地獄ラヂオ」の公開を開始した。
「Windows Embedded NavReadyの紹介」に続き、富士通ソフトウェアテクノロジーズの杉本拓也氏は、Windows Embedded CEによるPND開発の実際について説明した。
富士通と富士通研究所は4日、2008年4月に発表した暗号化機能搭載2.5型HDD「MHZ2 CJ」シリーズが、ハードディスクとしては初めて「JIS X 19790」に基づくセキュリティ認証を取得した...
富士通研究所は21日、窒化ガリウム(GaN)高電子移動度トランジスタ(HEMT:High Electron Mobility Transistor)を用いて、C帯(4GHz〜8GHzの周波数帯)で3...
富士通と富士通研究所は10日、マイクロ波帯〜ミリ波帯の送信用増幅器に適した新構造の窒化ガリウム高電子移動度トランジスタ(HEMT)を発表した。
元気モバイルとアルカディア7日、携帯電話用ソフトウェアプラットフォーム「Android」に向け、音声認識・音声合成機能を組み合わせたミドルウェアを共同開発することを発表した。
KDDI研究所は19日、名古屋工業大学徳田恵一教授との共同研究により、携帯電話端末で動作可能な日本語音声合成技術を開発し、ダウンロードにより複数の声質での音声合成機能を携帯電話端末に追加するソフトウ...
富士通研究所は16日、センサーなどのさまざまなユビキタス機器から収集される現場の情報を、人やモノといったIDの単位に関係づけて体系的に利用可能とするID情報の格納技術を発表した。
コードギアス製作委員会とNECビッグローブは、人気アニメ「コードギアス 反逆のルルーシュ R2」のキャラクターの音声をネット上で利用者が自由に作成できる音声合成サービスを開始した。
咽頭癌などで声帯を摘出する予定の人には朗報だ。OKIは24日、自分の声で音声合成ができるソフトウェア「Polluxstar(ポルックスター)」を本日から提供開始する。
富士通研究所は3日に、長時間撮影されたデジタル映像データにおいて、分割して保存・管理したり、一部を切り出した場合でも、その映像がもとの映像の一部であり、改ざんがないことや撮影された時刻の確認を可能に...
富士通と富士通研究所は19日、インパルス無線伝送方式に基づく70〜100GHz帯送信器の開発に世界で初めて成功したことを発表した。
富士通マイクロエレクトロニクスは16日、モバイル端末向けモバイルWiMAX小型モジュールに最適化したチップセットを開発した。サンプル価格はセットで8,000円。8月よりサンプル出荷を開始する。
富士通研究所は13日に、部屋の中にいる人を漏れなく追跡する業界初の画像センシング技術を発表した。
富士通は7日、滋賀銀行におけるビジネス情報ナビゲーションシステムを構築したことを発表した。
富士通研究所は30日、国立天文台ハワイ観測所と共同で宇宙線の一種である中性子線によって引き起こされる先端LSIの誤動作、ソフトエラーの利用現場における発生率を短期間で高精度に測定する技術を確立した。
















































