産業技術総合研究所(産総研)は12日、日本語の音声データを対象とした全文検索サービス「Podcastle(ポッドキャッスル)」を公開し、実証実験を開始した。ユーザーが指定したキーワードを含むポッドキャストを全文検索することが可能で、音声も視聴できる。
産総研では、不特定多数のユーザーが音声データの誤認識を訂正できるインターフェイスを開発。その訂正結果を学習・反映させることで、音声検索と音声認識の性能を向上させる。さらに、インターネット上のニュース記事や辞書などから新しい言葉を自動学習する技術も開発した。
|
PodCastleの概念イメージ
|
Podcastleでは、自動収集したポッドキャストを音声認識でテキスト化。これをインデックス化することで、ユーザーが入力した検索キーワードと照合して全文検索結果を表示する。検索結果では、キーワード周辺の音声認識結果も表示され、実際に元のサイト上から音声を聴くことも可能だ。
|
ポッドキャストに対する全文検索の画面例。左のトップページの画面でキーワードをタイプ入力すると、右のような検索結果の画面が表示される
|
音声データの誤認識を訂正するインターフェイスでは、音声認識時に最終的な認識結果とともに複数の候補結果を提示。ユーザーは正しい候補を選ぶだけで訂正できるほか、候補にない場合はタイプ入力することで、索引付けが正しく行なわれる。多数のユーザーが訂正することで、音声の検索・認識の性能が向上するという。
|
音声データの誤認識を訂正するインターフェイスの画面例。全文検索結果から興味のあるポッドキャストを選択すると、左の画面になり、検索したキーワード周辺の音声認識結果を再生しながら見ることができる。区間ごとに一番上が認識結果、その下に並んでいるのが可能性の高い候補であり、適切な候補を選択するだけで訂正できる。右の図のような全文表示にも切り替えられる(音声認識の信頼性が低い区間が、赤色で着色されている)
|
このほか、新語の自動学習技術では、音声認識辞書に言葉を追加するだけでなく、その前後の文脈も学習するため、より的確な認識が可能だという。従来は手作業で新語を音声認識辞書に加えていたため、「アメリカのサブプライムローン問題」のような前後のつながりは学習できなかったが、Podcastleでは文脈を自動学習するため、的確な認識が行なえるとしている。
Podcastleは、産総研の情報技術研究部門メディアインタラクショングループの研究員らが開発。6月14日と15日に国立京都国際会館で開催される「第7回産学官連携推進会議(内閣府等主催)」で、デモンストレーション展示を行なう。
関連情報
■URL
Podcastle
http://podcastle.jp/
ニュースリリース
http://www.aist.go.jp/aist_j/press_release/pr2008/pr20080612/pr20080612.html
( 増田 覚 )
2008/06/13 17:30
- ページの先頭へ-
|