ニュース
歴史的地名の「行政区画変遷」をオープンデータとして公開~ROIS-DSと平凡社地図出版
「日本歴史地名体系」の機械可読データ化に向けた協働を推進
2023年10月19日 06:00
大学共同利用機関法人情報・システム研究機構のデータサイエンス共同利用基盤施設(ROIS-DS)人文学オープンデータ共同利用センター(CODH)と株式会社平凡社地図出版は10月18日、「日本歴史地名体系」の機械可読データ化に向けた協働の一環として、歴史的地名の「行政区画変遷」を大規模オープンデータとして公開した。「日本歴史地名統合データベース(れきちめ)」よりダウンロードできる。
「日本歴史地名体系」は、全国の歴史研究者の協力を得て編纂され、地名研究および地域史研究の成果を集め、平凡社が1979年から2004年にかけて出版した50巻・51冊の地名辞典。今回のオープンデータでは行政区画変遷を初めて機械可読データとして公開するとともに、行政区画変遷に関連する地名項目約8万件の位置情報なども整備して公開した。
公開するのは、「日本歴史地名体系」地名項目データセット(7万9502件)と、「日本歴史地名体系」行政地名変遷データセット(3611件)の2種類。
「日本歴史地名体系」地名項目データセットは、オンライン辞書・事典検索サイト「ジャパンナレッジ」に収録された日本歴史地名体系の地名項目を対象に、ジャパンナレッジ項目IDと地名、読み、緯度・経度などを1レコードとするデータセットを公開した。ジャパンナレッジ版の日本歴史地名体系では一部の地名にしか緯度・経度が付与されていないが、今回の公開にあわせて多くの地名の緯度・経度を推定してデータセットを強化した。
「日本歴史地名体系」行政地名変遷データセットは、一般社団法人百科綜合リサーチ・センターによってデジタル化された日本歴史地名体系の付録「行政区画変遷表」をもとに作成した。このデータセットは、1889年以前の明治期から17世紀の江戸期までの行政区画の変遷について遡及したものとなる。
行政区域のデータセットについては、日本の行政区域に市区町村IDを付与し、境界(ポリゴン)データを紐付けるなど行政区域の地理情報を統合したデータベースとして「歴史的行政区域データセットβ版」(1万6857件)を2017年にオープンデータとして公開しており、こちらは1889年以降の行政地名を対象としているが、現在は1920年~2023年のデータセットを公開している。このデータについても、今回オープンデータ化された「日本歴史地名体系」行政地名変遷データセットと連携して更新していく方針で、栃木県と群馬県については1889年~1919年のデータセットを先行公開しており、今後は全国に拡大する。
さらに、現代から江戸時代までを通して使えるように、「日本歴史地名体系」行政地名変遷データセットと「歴史的行政区域データセットβ版」の2つをあわせて表記の揺れや連続性などを調査し、市区町村IDを付与する。この市区町村IDは、江戸時代の郷帳に記録された藩政村まで遡及できる地名識別子として整備する。
今回公開したデータセットは初期版で、今後の予定としては、「日本歴史地名体系」地名項目データセットについては地名の緯度・経度の精度を高めるとともに、「日本歴史地名体系」行政地名変遷データセットについては全国の都道府県に対象を拡大する作業を進める方針としている。