NHK放送技術研究所では5月26日から29日まで、放送技術の研究成果などを一般に公開する「技研公開2005」を開催している。ここでは主に放送局側で用いられるのシステムの研究として、番組の情報を記述する「メタデータ」を自動的に生成する研究と、JPEG2000を用いた低遅延コーデックを紹介する。
● 音声や映像の自動認識により番組内容の「メタデータ」を作成
|
メタデータ作成システム
|
ホームサーバーやネットワーク上のサーバーに蓄積された番組を、視聴者が好きな時間に見ることができる「サーバー型放送」も実用化に向けて研究が進んでいるが、ここで重要になってくるのが、コンテンツに何が記録されているかを示す「メタデータ」をどのようにして充実させるかという問題だ。
サーバー型放送では、たとえばサッカーの中継で中田英寿選手が映っているシーンに「中田英寿」というメタデータが記録されていれば、中田英寿選手が映っているシーンだけを再生したり、出演番組をアーカイブから検索して視聴するといったことが可能になる。よりきめ細かいサービスを提供するためには、可能な限り詳細なメタデータが各番組について記録されていることが望ましいが、これをすべての番組で記述しようとすると多くの人手が必要となる。
展示会場では、こうしたメタデータを自動的に記述するための研究が紹介されており、サッカーの試合中継を題材にしたデモが行なわれている。デモのシステムでは、まずあらかじめ選手の顔データを登録しておき、画像認識技術により画面に誰が映っているかを分析する。さらに、映っている映像の構図の分析や、音声認識技術によるアナウンサーの言葉の分析などから、その時点で誰がどのようなプレーをしたのかという情報を抽出する。これを時系列に並べることで、「10分30秒に中田選手がシュートを放った」といったメタデータが自動的に作成できる仕組みだ。
研究の今後については、さらに様々なジャンルの番組についてメタデータを抽出する方法を確立し、抽出精度の向上を図っていきたいとしている。
● JPEG2000を利用した低遅延のコーデックは緊急報道などの現場に有効
展示会場では緊急報道用のシステムとして、JPEG2000によるハイビジョン伝送コーデックが紹介されている。JPEG2000は、画像圧縮方式であるJPEGの次世代の規格として2000年に標準化された規格で、異なる解像度の画像が取り出せる階層構造をサポートしている。これを動画の圧縮方式として利用するのがMotion-JPEG2000で、動画の各フレームをJPEG2000方式で圧縮する形式のため、圧縮・展開が容易で遅延の少ないコーデックとして利用できる。
展示されているシステムでは、低遅延であるという特徴や、PCでも扱いやすいという特性から、緊急報道などの番組制作の現場を用途として想定している。中継先とスタジオでアナウンサー同士が掛け合いながら進行していくような場合には、遅延が少ないコーデックであることが有利になる。また、IPネットワークに流した場合でも、JPEG2000をベースとしているため、ネットワークの回線速度に応じた画質を取り出すこともでき、放送局内でPCとIPネットワークで映像を共有することで、番組制作が効率化できるとしている。
技術の開発にあたっては、Motion-JPEG2000では生中継を行なう場合の規格が策定されていないため、コーデックや送信システム、PCでMotion-JPEG2000を再生できるソフトとの連携など、独自に開発しなければならない点が多かったという。今後はさらに緊急報道のシステムや設備・運用などを考慮して、実際の運用に向けた検討を進めていくという。
|
|
JPEG2000によるハイビジョン映像をネットワーク経由でPCで視聴
|
JPEG2000によるハイビジョン伝送システムの概要
|
関連情報
■URL
技研公開2005
http://www.nhk.or.jp/strl/open2005/
NHK放送技術研究所
http://www.nhk.or.jp/strl/
( 三柳英樹 )
2005/05/27 17:05
- ページの先頭へ-
|