Internet Watch logo
記事検索
最新ニュース

研究用に「Yahoo!知恵袋」5年間のデータ提供、国立情報学研究所


 国立情報学研究所は3日、Q&Aサービス「Yahoo!知恵袋」の2004年4月から2009年4月までのデータ提供を開始した。利用は無料。情報検索システム評価用テストコレクション構築プロジェクト(NTCIR)の参加者、および同プロジェクトに関連する分野の研究を行っている研究者が対象となる。データ入手などの詳細は、国立情報学研究所IDR事務局にメールにて問い合わせる。

 国立情報学研究所では、2007年3月にヤフーと「Yahoo!知恵袋」の研究利用契約を締結し、データを情報関連技術研究コミュニティに対して無償提供している。今回はその第2弾として、「Yahoo!知恵袋」が開始された2004年4月から2009年4月までに蓄積されたデータを一挙に提供することになった。参照できる質問数は2600万件、回答数は7300万件に上る。これらサンプルを、現代語の研究などに役立てられる。

 また、「Yahoo!知恵袋」が2006年5月より対応している携帯電話からの投稿データも参照できるようになったほか、第1弾データ(2004年4月〜2005年10月)提供後に機能追加された投稿に付随するデータ(評価数、閲覧数、コイン数、知恵コレクション数、モバイルフラグ、メール投稿フラグなど)も加わった。なお、第1弾データの提供実績は、提供機関数が30機関、提供チーム数が34チーム、研究者数が94人となってる。


関連情報

URL
  ニュースリリース
  http://www.nii.ac.jp/index.php?action=pages_view_main&page_id=888
  Yahoo!知恵袋
  http://chiebukuro.yahoo.co.jp/

関連記事
「Yahoo!知恵袋」のデータを研究目的で利用、国立情報学研究所が契約締結(2007/03/06)
「Yahoo!知恵袋」リニューアル、ベストアンサーへのお礼機能など追加(2006/12/19)


( 野津 誠 )
2009/06/03 18:06

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2009 Impress Watch Corporation, an Impress Group company. All rights reserved.