ニュース

国立情報学研究所、「クックパッドデータセット」を研究者向けに提供

 国立情報学研究所(NII)は24日、クックパッド株式会社の協力によるレシピと献立のデータセット「クックパッドデータセット」を研究者向けに提供を開始した。

 提供されるデータは、クックパッドで2014年9月30日までに公開されたレシピ約172万点と、献立約3万6000件に関するデータ。いずれもクックパッド上で閲覧できるデータで、レシピのデータにはタイトル、材料、手順、つくれぽ(作りましたフォトレポート)など、献立のデータにはタイトル、調理時間、ポイント、コツなどが含まれる。

 提供されるファイルは、7z形式で圧縮したMySQLのバックアップファイルで、サイズは約1.8GB(展開後は約5.5GB)。

 データは、大学および公的研究機関の研究者を対象としての提供で、利用目的は研究に限られる。利用には申請が必要で、NIIとクックパッドによる審査がある。

 クックパッドの開発者ブログでは、大学の研究者から「クックパッドのデータを研究に使用したい」といった相談を受けることがあり、料理に関する研究を支援する目的でデータを公開すると説明。また、クックパッドのデータを使用するために悪質なクロールが行われることがあり、データの公開には悪質なクロールを減らしたいという動機もあるとしている。

(三柳 英樹)