Internet Watch logo
記事検索
最新ニュース

「Yahoo!知恵袋」のデータを研究目的で利用、国立情報学研究所が契約締結


左から、国立情報学研究所の東倉洋一副所長、大山敬三教授、ヤフーの岡本真氏
 国立情報学研究所は6日、Q&Aサイト「Yahoo!知恵袋」のデータを研究目的で利用する契約をヤフーと締結し、データを情報関連技術研究コミュニティに対して無償で提供すると発表した。

 国立情報学研究所では、ブログや掲示板、Q&Aサイトなどの利用者発信情報は、情報爆発と呼ばれる現状において情報学研究の必須のデータとなっているが、こうしたデータは個人情報を含む上にプロバイダー等が所有するデータであったため、研究コミュニティからは利用しにくい状況にあったと説明。今回、ヤフーとの契約によってQ&Aサイトのデータが研究に利用できるようになり、新たな研究に向けた第一歩を踏み出したとしている。

 Yahoo!知恵袋は、質問総数が1,000万件以上、回答総数が3,500万件以上に達している日本最大級のQ&Aサイト。ヤフーでは、Yahoo!知恵袋をベータ版としてサービスを提供していた2004年4月から2005年10月までの時期の、質問約311万件、回答約1,347万件、本文約16億字について、個人情報を特定できない形でデータとして提供する。

 データとしてYahoo!知恵袋を選んだ理由については、Q&Aという一定の形式であるために利用がしやすいことや、Yahoo!知恵袋ではサービス開始時から研究目的などに利用することがあることを利用規約で明記していることが挙げられた。また、ヤフーとしては今回はデータを提供するのみで、研究成果が独占的に利用できるといった契約ではないという。この点についてヤフーの岡本真氏は、「研究目的でのオープンな形でデータを公開することにより、研究が進んでいくことで、最終的には利益が還元されるのではないかと考えている」とした。

 国立情報学研究所の東倉洋一副所長は、従来の書き言葉を主体としたWeb上のテキスト情報に対して、書き言葉と話し言葉の中間的存在としてブログやQ&Aサイトなどのテキスト情報が急増しており、これを研究対象として利用できることで研究の幅が広がると説明。また、従来も掲示板などのテキストデータを論文に利用する例はあったが、正式に提供を受けたことで研究者間で共通のデータとして利用できるようになり、研究に使用したデータの期間や範囲が明確になるという利点があるとした。国立情報学研究所では今後、さらにプロバイダーなどの協力を得て、研究に利用できるデータを拡充させていきたいとしている。


書き言葉と話し言葉の中間的存在として「Yahoo!知恵袋」のデータを研究対象に 今後はさらに他のプロバイダー等からのデータ提供を目指す

関連情報

URL
  ニュースリリース
  http://www.nii.ac.jp/news_jp/2007/03/web_20_yahoo_1.shtml
  Yahoo!知恵袋
  http://chiebukuro.yahoo.co.jp/

関連記事
Yahoo! JAPAN、Q&A形式で情報交換できる新サービス「Yahoo!知恵袋」(2004/04/07)
Yahoo!知恵袋が正式サービス移行。ニックネームでの質問/回答が可能に(2005/10/20)


( 三柳英樹 )
2007/03/06 17:46

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2007 Impress Watch Corporation, an Impress Group company. All rights reserved.