Internet Watch logo
記事検索
最新ニュース

筆者の感情もとに音声合成、NECが「聞いて見て楽しいブログ」


文章から筆者の気持ちを推定し音声合成や文字装飾できる技術を用いて開発した「聞いて見て楽しいブログ」
 NECは6日、テキストデータから筆者の気持ちを推定することで、筆者の感情に合わせた音声合成や文字装飾ができる技術を開発した。この技術を応用して、携帯電話から音声メッセージと写真をメールで送信するだけで、音声合成による読み上げや文字飾りを施したブログを作成できるシステムも開発した。

 今回NECが開発したのは、テキストデータを解析し、各文に込められた筆者の気持ちがポジティブかネガティブかどうかを推定する「マインド判定技術」と、解析した気持ちに合わせて合成音声の特性(トーン)を多様に変更できる「可変トーン音声合成技術」の2つ。

 マインド判定技術では、「楽しい」「悔しい」などの感情を表す語句が含まれた文章から、筆者の気持ちを判定。感情を表す語句を含まない場合でも、評価表現と評価対象をもとに気持ちを推定できるという。例えば、感情表現ではない「長い」という形容詞に「行列」が続いた場合は、ネガティブな気持ちと判定する。

 可変トーン音声合成技術では、読み上げの速さ、声の高さや太さ、明るさなど、話者の特性を表すパラメータを大きく変更しても、滑らかな音声を合成することが可能。マインド判定技術によって筆者の気持ちが判定された文章を、パラメータを組み合わせた特徴的な音声を切り替えて読み上げることで、楽しく文章を読み上げられるとしている。

 これら2つの技術を活用して開発したシステム「聞いて見て楽しいブログ」では、1)携帯電話から投稿されたブログ用音声メッセージを音声認識技術によりテキストデータへ変換、2)テキストデータ中の筆者の気持ちをマインド判定技術により推定、3)推定した気持ちをもとに、テキストデータを読み上げる音声の特性、テキストの文字色/サイズ、挿入する絵文字の自動設定を行う。


関連情報

URL
  ニュースリリース
  http://www.nec.co.jp/press/ja/0904/0602.html


( 増田 覚 )
2009/04/06 14:53

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2009 Impress Watch Corporation, an Impress Group company. All rights reserved.