5月24日から27日まで開催する「技研公開2007」では、番組を「作る」「送る」「使う」技術に分けて最新技術を紹介する。「作る」では、映像コンテンツの検索・活用術や翻訳支援システムなどを展示する。
● 映像からメタデータを生成して活用する
|
画像認識による登場人物の検出・識別
|
映像コンテンツの検索・活用技術では、映像の内容を説明するメタデータを自動的に取り出すための各種解析技術を紹介。画像、字幕情報、知識(野球のルールなど)を使って、メタデータを抽出することが可能という。
「画像認識による登場人物の検出・識別」では、画面上の人間の顔の位置を検出したり、特定の人物の割り出しが可能。顔の位置を自動検出する技術は、映像素材に対し、顔画像検出と遮蔽判定を行なうことで実現している。
「ニュースの字幕がキャスターの顔に被らないようにするには、従来だと、放送中の画面を見ながら手作業で字幕を消したり、出したりしていた。自動検出が実現すれば、その手間がなくなる」とNHK技研の担当者は話す。
人物識別は、数十人のサンプルの中から、基となる人物の顔と一致する人物を自動的に特定できる技術。元画像の目や鼻、口など、顔の特徴的な部分にポイントを付け、ポイントの位置が同じ人物を解析して、割り出すもの。これにより、例えば、スポーツ中継などでファインプレーをした選手の顔を識別し、自動的に名前などの字幕を表示することが可能という。
「画像認識によるスポーツのイベント識別」では、画面上の人間の位置や動きなどから、何をしているシーンかを解析することが可能。例えば、サッカーの場合、選手のユニフォームの色でチームを判別し、フィールド上の人間の分布を解析することで、キックオフやコーナーキックなどのシーンを割り出す。「60~70%の識別が可能」という。
また、野球の場合は、三振やホームランなどで決まって用いられるカメラワークをシステムに学習させ、カットの組み合わせから、何をしたシーンかを解析する。さらに、投球の軌跡から球種を判別することも可能。これらの技術は、将来的には、ユーザーのHDDレコーダーなどに搭載して、シーンを自動的にキャプチャー登録できるようにするという。
|
|
スポーツイベントの識別
|
野球イベント識別
|
|
|
映像による球種判別は珍しいという
|
野球映像ダイジェストの生成
|
このほか、動物番組などの字幕を解析してシーンの内容を判別、映像とテキストを抜き出した百科事典を作成する「言語処理によるマルチメディア百科事典の生成」技術や、電子番組表(EPG)の内容を解析して、当てはまる映像を検索し、30秒程度の番組スポットを作成する「言語処理による番組紹介ビデオの生成」技術を紹介していた。
メタデータ付き映像の利用例としては、「知識処理による野球ダイジェスト」を紹介。メタデータが付けられたシーンを組み合わせて、ダイジェストを作成するもので、例えば、1つの試合映像から、“フルカウントで三振をとった”と定義されたダイジェストを選択すると、当該のシーンを検索して再生できる。また、“イチロー”と“ヒット”を選択して紐付け、当該のシーンを抜き出すことも可能だ。
その他の利用例としては、「Webを活用した学習システム」を紹介。小学生向けの学校教材をイメージしたもので、検索した内容に当てはまる動画をクリップし、学習レポートが作成できる。レポートは、NHK技研が開発したプログラム言語「TVML」によって、テレビ番組仕立ての動画として再生できる。CGのキャラクターがクリップした動画を紹介する。レポートは、他のユーザーに公開することも可能だ。
翻訳支援システムとして、協調型翻訳システム「翻訳パレット」を展示。国際放送サービスを視野にしたもので、日本語のニュース原稿を英訳する際に使用する。翻訳パレットに元原稿を入力すると、辞書に載っていないような単語や珍しい言葉があった場合、Web上の辞典や過去の原稿から検索して翻訳候補を提示する。現在のところ、対応する翻訳は英訳のみとなっている。
|
|
字幕を解析して百科辞典を生成
|
生成された百科辞典の例
|
|
|
EPGを解析して番組紹介ビデオを生成
|
「調べ学習」などに活用できる学習支援システム
|
|
翻訳パレットの例
|
関連情報
■URL
技研公開2007
http://www.nhk.or.jp/strl/open2007/
■関連記事
・ NHKの技研公開、スーパーハイビジョンやオンデマンド配信を展示(2007/05/22)
( 野津 誠 )
2007/05/23 13:51
- ページの先頭へ-
|