ニュース

国立情報学研究所、ニコ動約830万作品のコメントデータ、研究用に提供開始

 国立情報学研究所(NII)は24日、株式会社ドワンゴの協力の下、「ニコニコ動画コメント等データ」の提供を開始したと発表した。

 2012年11月初旬までにニコニコ動画に投稿された約830万件の動画のメタデータと、それに対するコメントデータを、NIIの情報学研究データリポジトリ(IDR)で公開する。なお、動画データ本体は含まれておらず、個人を特定するユーザーIDは削除されている。IDRのサイトから申請することで、研究目的であれば誰でも利用できる。

 メタデータには、タイトル、説明文、タグ、投稿日時、再生数、コメント数などのデータが含まれており、カンマ区切りのテキストファイルで提供される。約2000ファイル(1ファイルあたり最大1万データ)あり、圧縮ファイルで約3GB、展開後は約12GB。

 コメントデータには、コメント本文、投稿日時、書き込み再生位置などのデータが含まれており、こちらもカンマ区切りのテキストファイルで提供される。1動画につき1ファイルとなっており、圧縮ファイルで約50GB、展開後は約300GB。

 NIIでは「大規模ソーシャルメディアデータは情報学研究のターゲットとして大きな注目を浴びており、ニコニコ動画も研究データとして大きな可能性がある」としており、研究用途に広く提供することとした。

(永沢 茂)