日本語ポッドキャストの全文検索サービス、産総研が公開

記事検索

最新ニュース

■

レゴ、小学生向けプログラミング教材「WeDo 2.0」発売

■

マクロウイルスを知らない世代の社員が狙われる？　「Office文書を開いて感染」攻撃が再び増加

■

新gTLD「.shop」、49億円でGMOが落札、AmazonやGoogleなどに競り勝つ

■

Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

■

インストール不要の非常駐型セキュリティソフト「Dr.Web CureIt!」、日本語版を無料で提供

■

筆まめ、中小事業者向け顧客管理ソフト「筆まめ顧客管理 Windows版」発売

■

大日本印刷が「サイバーナレッジアカデミー」設立、IAIの訓練システムでセキュリティ技術者を養成

■

「インターネット白書2016」発売、20周年記念の特別版

■

NEC、中小規模事業者向けセキュリティアプライアンス「Aterm SA3500G」を発売

■

Synology、2ベイNASのハイエンドモデル「DS216+」、暗号化データも上下100MB／秒以上で高速転送

■

公安9課が情報流出の危険性を解き明かす、「攻殻機動隊 S.A.C.」の描き下ろしPDFコミック「HUMAN-ERROR TRAPS」無償公開

■

Google Playに「マンガストア」オープン、ジャンプコミックスも配信開始

■

BIGLOBE、電力とインターネットのセットプラン、中部電力の首都圏エリア展開に合わせ

■

ウェブブラウザーのプライベートブラウジング機能、認知していた人は23.1％

■

LINE、違う電話番号のスマホから一方的にアカウント移管操作を行えないよう仕様変更

■

LINEのiPhone版アプリがiPadにも対応、「LINE for iPad」より多機能、大画面で音声・ビデオ通話が可能に

■

Microsoft、Officeと他社クラウドストレージとの連携を強化

■

Googleのディープラーニングシステムによって、人工知能が初めて囲碁のプロ棋士に勝利

■

ソラコム、IoTプラットフォーム「SORACOM」と既存システムを専用線でつなぐサービスや認証機能など提供開始

■

Google「Chrome 48」iOS版ではクラッシュ率70％低下、JavaScript実行速度も大幅改善

日本語ポッドキャストの全文検索サービス、産総研が公開

　産業技術総合研究所（産総研）は12日、日本語の音声データを対象とした全文検索サービス「Podcastle（ポッドキャッスル）」を公開し、実証実験を開始した。ユーザーが指定したキーワードを含むポッドキャストを全文検索することが可能で、音声も視聴できる。

　産総研では、不特定多数のユーザーが音声データの誤認識を訂正できるインターフェイスを開発。その訂正結果を学習・反映させることで、音声検索と音声認識の性能を向上させる。さらに、インターネット上のニュース記事や辞書などから新しい言葉を自動学習する技術も開発した。

PodCastleの概念イメージ

　Podcastleでは、自動収集したポッドキャストを音声認識でテキスト化。これをインデックス化することで、ユーザーが入力した検索キーワードと照合して全文検索結果を表示する。検索結果では、キーワード周辺の音声認識結果も表示され、実際に元のサイト上から音声を聴くことも可能だ。

ポッドキャストに対する全文検索の画面例。左のトップページの画面でキーワードをタイプ入力すると、右のような検索結果の画面が表示される

　音声データの誤認識を訂正するインターフェイスでは、音声認識時に最終的な認識結果とともに複数の候補結果を提示。ユーザーは正しい候補を選ぶだけで訂正できるほか、候補にない場合はタイプ入力することで、索引付けが正しく行なわれる。多数のユーザーが訂正することで、音声の検索・認識の性能が向上するという。

音声データの誤認識を訂正するインターフェイスの画面例。全文検索結果から興味のあるポッドキャストを選択すると、左の画面になり、検索したキーワード周辺の音声認識結果を再生しながら見ることができる。区間ごとに一番上が認識結果、その下に並んでいるのが可能性の高い候補であり、適切な候補を選択するだけで訂正できる。右の図のような全文表示にも切り替えられる（音声認識の信頼性が低い区間が、赤色で着色されている）

　このほか、新語の自動学習技術では、音声認識辞書に言葉を追加するだけでなく、その前後の文脈も学習するため、より的確な認識が可能だという。従来は手作業で新語を音声認識辞書に加えていたため、「アメリカのサブプライムローン問題」のような前後のつながりは学習できなかったが、Podcastleでは文脈を自動学習するため、的確な認識が行なえるとしている。

　Podcastleは、産総研の情報技術研究部門メディアインタラクショングループの研究員らが開発。6月14日と15日に国立京都国際会館で開催される「第7回産学官連携推進会議（内閣府等主催）」で、デモンストレーション展示を行なう。

関連情報

■URL
　 Podcastle
　 http://podcastle.jp/
　ニュースリリース
　 http://www.aist.go.jp/aist_j/press_release/pr2008/pr20080612/pr20080612.html

（増田覚）
2008/06/13 17:30

- ページの先頭へ-

INTERNET Watch ホームページ

Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.