Internet Watch logo
記事検索
最新ニュース

NTT、J-POPや演歌を再現できる音声合成技術「ワンダーホルン」


人工音声との違いをパネルを使って説明するNTTサイバースペース研究所の青野裕司工学博士

歌声データベースの収録風景。約1時間程度で50音収録できるという
 NTTとNTTアドバンステクノロジ(NTT-AT)は、日本語のポップスや演歌を合成した音声で再現できる歌声音声合成技術「ワンダーホルン」の提供を開始した。当初はゲームメーカーやコンテンツプロバイダー向けに提供し、一般ユーザー向けの製作ツールなどは今後販売する予定だ。

 ワンダーホルンは、NTTが2000年9月に発表した音声合成技術が元になったもので、あらかじめ収録した音声ライブラリを、その場で入力した楽譜と歌詞にあわせて歌声を合成できる。音声合成に、100~700Hzの音域を合成できる「正弦波重畳方式」を採用。テキストの読み上げなどの音声合成に利用される「波形重畳方式」に比較して、幅広い音域をカバーできる正弦波重畳方式によって、歌声の特徴である「倍音成分(Harmonic Overtone)」の再現に成功したという。

 さらに、正弦波重畳方式に肉声のノイズ成分を付加することによって、「ビブラートやコブシの回しぐあいも調整できる」(NTT第三部門プロデュース担当山崎王義チーフプロデューサ)ようになった。調整次第では、ポップスや演歌、合唱などを再現できるという。また、シンセサイザーと連動させて、叩いた鍵盤の音階で音声メッセージを出力することも可能となっている。

 歌声を合成するには、まず、対象となる歌手の声紋50音分をサンプリングしてデータベースを作成。市販のMIDIツールで作成した楽譜・歌詞データを用意し、それらと歌声データべースをワンダーホルンの歌声合成システムで合成する。出力されるデータはMIDI規格に準拠しており、WAVE形式での出力も可能だ。なお、サンプリングレートは音楽CDと同じく44.1kHz。NTTサイバースペース研究所メディア処理プロジェクト音声・言語基盤技術グループの青野裕司工学博士によれば、「高音域と低音域で若干声に“のび”が足りない部分もあるが、特に不可聴帯域の圧縮などは行なっていない。技術的にはさらに自然な音質に近づけられる見込みだ」という。現在日本語の歌声のみに対応しているが、今後は英語や韓国語にも対応するとしている。

 NTT-ATでは、ワンダーホルンの提供に合わせてデモサイト「うたばら.com」をオープンした。うたばら.comでは、「舟歌」「夜空ノムコウ」「炎のファイター」の音声合成サンプルを無償で配布。また、ベートーヴェンの交響曲第九番「喜びの歌」などをモチーフに、好きな歌詞を入力して、替え歌を楽しめるコーナーも用意した。

 ワンダーホルンは、「アルゴリズムの軽量化と歌声データベースの圧縮により、高性能なPCだけでなく、家庭用ゲーム機やDSP搭載カラオケ機などのプラットフォームで動作させることができる」(青野氏)という。NTT-ATメディアソリューション事業本部メディアサービス事業部の山森和彦事業部長によると「現在、ゲームメーカーのセガと交渉中だ」とコメント。ほかにも「携帯電話向けに“着うた”のようなサービスも提供できる」としている。


デモサイト「うたばら.com」 替え歌コーナーでは、好きな歌詞を入力すると、曲に入力した文字が割り当てられる

NTT第三部門プロデュース担当山崎王義チーフプロデューサ。「ビブラートやコブシの回しぐあいも調整可能になり、事業として提供できるようになった」 NTT-ATメディアソリューション事業本部メディアサービス事業部の山森和彦事業部長。「現在セガと交渉中だ」という

関連情報

URL
  ニュースリリース
  http://www.ntt-at.co.jp/news/2004/release05.html
  うたばら.com
  http://www.utabara.com/


( 鷹木 創 )
2004/02/06 18:21

- ページの先頭へ-

Internet Watch ホームページ
Copyright (c) 2004 Impress Corporation All rights reserved.