ニコ動やYouTubeの音声をテキスト化する「PodCastle」、産総研が公開


PodCastleの画面例

 独立行政法人産業技術総合研究所(産総研)は12日、インターネット上の動画中の音声を認識し、全文検索や書き起こしが行えるサービス「PodCastle(ポッドキャッスル)」を一般公開し、実証実験を開始した。

 産総研では、日本語のポッドキャストを音声認識によりテキスト化し、全文検索が行えるサービスとして、2008年6月にPodCastleを公開。PodCastleは、閲覧した不特定多数のユーザーがテキストに訂正を加えられ、訂正結果を学習・反映させることで、音声検索と音声認識の性能を向上させる点が特徴となっている。

 今回公開したサービスでは、新たに動画共有サービスの音声に対応。ニコニコ動画、YouTube、Ustreamの動画に対応し、動画中の音声を自動認識してテキスト化し、全文検索を行える。また、テキスト化したデータの誤認識を訂正できる機能に加えて、話者や改行を付け加えて書き起こし形式の文章として編集できる機能も追加。さらに日本語に加えて、英語の音声データも認識と検索ができる機能を追加した。

 PodCastleの利用は無料で、動画データやポッドキャストの登録にはOpenID(Twitter、Google、mixi、Yahoo! JAPAN、Yahoo.com、Livedoor)によるログインが必要となる。

 産総研では、10月13日~14日に産総研つくばセンターで開催する「産総研オープンラボ」で、この研究成果に関するデモンストレーション展示を行う。


関連情報


(三柳 英樹)

2011/10/12 18:51