ニュース
国立情報学研究所、「クックパッドデータセット」を研究者向けに提供
(2015/2/24 19:22)
国立情報学研究所(NII)は24日、クックパッド株式会社の協力によるレシピと献立のデータセット「クックパッドデータセット」を研究者向けに提供を開始した。
提供されるデータは、クックパッドで2014年9月30日までに公開されたレシピ約172万点と、献立約3万6000件に関するデータ。いずれもクックパッド上で閲覧できるデータで、レシピのデータにはタイトル、材料、手順、つくれぽ(作りましたフォトレポート)など、献立のデータにはタイトル、調理時間、ポイント、コツなどが含まれる。
提供されるファイルは、7z形式で圧縮したMySQLのバックアップファイルで、サイズは約1.8GB(展開後は約5.5GB)。
データは、大学および公的研究機関の研究者を対象としての提供で、利用目的は研究に限られる。利用には申請が必要で、NIIとクックパッドによる審査がある。
クックパッドの開発者ブログでは、大学の研究者から「クックパッドのデータを研究に使用したい」といった相談を受けることがあり、料理に関する研究を支援する目的でデータを公開すると説明。また、クックパッドのデータを使用するために悪質なクロールが行われることがあり、データの公開には悪質なクロールを減らしたいという動機もあるとしている。