NEC、話し言葉からキーワードを高精度に抽出する音声認識技術を開発


 日本電気株式会社(NEC)は6日、人が自然に発話した話し言葉から、人名や地名など複数のキーワードを高精度に認識して抽出する音声認識技術を開発したと発表した。

 開発した技術は、人名や日付など、検索条件のキーワードが質問文中のどのような文脈で出現したかを確率モデルとして学習し、利用することで、入力音声からキーワードの出現位置と種類を自動的に推定。たとえば、レストランを検索する場合、検索条件となる料理名の周囲には、「~のお店」「~がおいしい」といった特徴的な表現が頻出するため、これらを自動学習して随時利用することで、高精度なキーワード位置と種類の推定を実現したという。

 また、複数の言語モデルの組み合わせ方をミリ秒単位の細かい時間単位で瞬時に制御する認識方法を開発し、検索キーワードに依存する言語モデルを推定結果に従って制御し、音声認識処理を検索キーワードに適応させる。

 NECでは、この技術を用いて、テレビ番組検索やレストラン検索などのシステムを想定した性能評価を行った結果、検索キーワードの音声認識誤り率を従来比で約3割削減できたと説明。今回開発した音声認識技術を、電話音声応答システムやコンタクトセンター支援システムなどの製品やソリューションをはじめ、営業管理システムやグループウェアなどにおけるモバイル端末からの音声入力といった様々な場面への応用が期待できるとしている。


関連情報

(三柳 英樹)

2011/10/6 15:23