ニュース

間取り図などの賃貸物件データセット533万件、研究者に無償提供~国立情報学研究所とHOME'S

 大学共同利用機関法人情報・システム研究機構国立情報学研究所(NII)と株式会社ネクストは、不動産情報データセット「HOME'Sデータセット」を11月24日より研究コミュニティに無償提供すると発表した。ネクストが運営する不動産・住宅情報サイト「HOME'S」で公開された全国の賃貸物件データ533万件を、NIIの「データセット共同利用研究開発センター」を通じ、研究リソースとして提供するもの。

 データセットはHOME'Sの2015年9月時点のスナップショットで、種別(マンション、アパート、一戸建てなど)、費用(賃料、管理費、敷金、礼金など)、面積、間取り、築年数、建物構造、立地(市区町村・郵便番号、最寄り駅・徒歩分、最寄り小学校・中学校・コンビニ・病院までの距離など)、諸条件(オートロック、システムキッチン、バス・トイレ別、エレベーター、駐車場など)、物件の特徴と、それらの物件にひも付けられたJPEG画像データ8300万枚(間取り図、外観、内装、玄関、居間、キッチン、寝室、風呂など。最大120×120ピクセル)が含まれる。なお、物件を直接特定可能な緯度経度や詳細な住所などの情報は含まれない。

 データセット共同利用研究開発センター長/コンテンツ科学研究系教授の大山敬三氏は、「画像とテキストのメディア統合情報処理研究や空間認識技術、感性情報検索などの研究での活用が想定される。また、所在地情報(市区町村)も付与されていることから、地域情報に基づいた情報統合・データマイニングなどへの展開や、地域情報や経済情報を扱う社会学への応用も考えられる」としている。

 なお、特定の企業・個人につながる情報や、HOME'Sの利用者の履歴といった個人情報は一切含んでいないため、利用上の制約が少なく、自由な発想で利用が可能。「異分野連携が進むとともに、データ提供者が想定していなかったような各研究者の独創的な発想に基づく利用が行われることを期待している」という。

 また、ネクストでは、より手軽にデータ利用を試せるよう、年内にGitHubでツールキットを公開予定。物件画像データへのディープラーニングの適用や、フリーテキスト情報中の頻出キーワード抽出(地域別、最寄り駅別など)などの処理がツールキットにより簡単に実行できるようになるとしている。

(永沢 茂)