データ版Wikipedia「Wikidata」プロジェクト開始~編集可能な構造化データを集積


 Wikimedia Foundationとそのドイツ支部であるWikimedia Deutschlandは30日、2006年以来の新プロジェクトとなる「Wikidata」を発表した。

 Wikidataは、ユーザーとマシンが編集可能なデータを集めたデータベースだ。データは構造化されておりマシンリーダブルであるため、コンピュータやアプリケーションなどから再利用できる。

 Wikidataは、280の言語で提供されているWikipediaに対してデータを共通化できるメリットがある。たとえば、各国の面積や人口、人の誕生日や科学定数といったデータを共有すれば、各言語版Wikipediaで同じデータが引用できるようになる。これにより、利用者数が少ない言語のWikipediaも情報の質を高め、メンテナンスリソースの減少が可能になると期待されている。

 Wikidataは、クリエイティブコモンズライセンスで公開される。Wikimedia関連プロジェクト以外にも政府、科学など、様々な分野で利用されることが期待されている。

 開発スケジュールは、各言語版Wikipediaのリンクをまとめる第1フェーズを2012年8月までに終了。Wikidataのデータを追加、使用可能になる第2フェーズが2012年12月頃にリリース、そしてWikidataからリストや表の自動生成が可能になる第3フェーズで初期段階の開発が終了することになる。この初期開発をWikimedia Deutschlandga行い、その後2013年3月までに、プロジェクトの運営とメンテナンスがWikimedia Foundationに移行する計画だ。

 開発資金は3団体が合計130万ユーロを提供する。その半分は、米Microsoft共同創業者Paul Allen氏によって設立されAllen Institute for Artificial Intelligenceが、そして4分の1はGordon and Betty Moore Foundationが、そして4分の1はGoogleが提供するとしている。


関連情報

(青木 大我 taiga@scientist.com)

2012/4/2 06:00