Internet Watch logo
記事検索
最新ニュース

ヤフー、検索語データを情報爆発プロジェクトの研究者向けに無償提供


ヤフーが提供する検索データの内容
 国立情報学研究所(NII)とヤフーは2月28日、「Yahoo!検索」の検索語データの利用について合意し、文部科学省が進める「情報爆発時代に向けた新しいIT基盤技術の研究(情報爆発プロジェクト)」にデータを無償で提供すると発表した。

 情報爆発プロジェクトは、文部科学省の科学研究費補助金による基礎研究プロジェクトで、大量の情報から必要とする情報を効率良く取り出すことを可能とする技術やシステムの構築を目指している。全国の大学などの総数87件に及ぶ研究プロジェクトを擁した大規模な共同研究で、2005年~2010年度に渡って実施される。NIIは情報爆発プロジェクトの事務局を務めている。

 ヤフーでは、NIIを通じて情報爆発プロジェクトに参加する研究者に対して、4月1日から検索語データを提供する。提供する検索語データは、Yahoo!検索において検索回数の多かった上位1万語。情報爆発プロジェクトに参加する様々な研究グループが、このデータを研究目的で無償で利用できる。


ヤフー検索事業部の井上俊一氏
 3月3日には情報爆発プロジェクトの2007年度成果報告会が開催され、プロジェクトの代表者を務める東京大学教授の喜連川優氏と、ヤフー検索事業部の井上俊一氏、京都大学教授の田中克己氏が登壇。今回の検索語データ提供の意義と、産学連携研究のあり方について語った。

 ヤフーから提供する検索語データは、「Yahoo!検索」で実際に検索された毎月の上位1万語と検索回数(相対値)のデータで、2007年の各月のデータを12カ月分、計12万語を提供する。井上氏はデータ提供の意義について、「こうしたデータをさらに研究者の方々に掘り下げてもらうことで、新たなサービスにつなげていければと考えている」と説明。また、今回のデータはあくまでも第1弾で、ランキングデータにとどまらずさらにデータを提供していきたいとした。

 喜連川氏は研究者の側から、「ブログなどの発信者情報を収集することは頑張ればできるが、検索語のような利用者のニーズは集めることができない」として、ヤフーという実サービスのデータが利用できることの意義を説明。田中氏も同様に、「Webから得られるデータと、ユーザーの検索語データはいわば両輪。検索エンジンのインデックスは既にAPIとして公開され、様々な研究に用いられているが、検索語のリストが提供されることは研究に非常にインパクトが大きい」と語った。

 井上氏もこうした意見に同意し、「ブログなどの登場で発信者情報は確かに増えたが、やはり数としては検索する人の方が圧倒的に多い」として、利用者側のニーズをどのようにサービスに反映させていくかという点はヤフーの課題でもあり、研究成果に期待したいとした。


検索語データはNIIを通じて研究者に提供される データ提供により産学連携から生まれる新たなデータに期待

関連情報

URL
  ニュースリリース
  http://www.nii.ac.jp/news_jp/2008/03/yahoo.shtml

関連記事
「Yahoo!知恵袋」のデータを研究目的で利用、国立情報学研究所が契約締結(2007/03/06)


( 三柳英樹 )
2008/03/03 20:55

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.