やじうまWatch
不評だった「KEN_ALL.CSV」大幅改善で話題に。代替となる住所CSVデータを日本郵便が公開、カナ全角化・レコード統合・UTF-8導入など
2023年7月6日 12:20
日本郵便が提供している住所CSVデータが大幅に改善され、一部で話題になっている。
日本郵便の「KEN_ALL.CSV」といえば、その汎用性の低い仕様ゆえ、かねてよりエンジニアの間では悪評が噴出していており、使いやすい形式に変換するための民間サービスまで登場していた。総務省はデジタル庁とも協議のうえでこれらに改善を施す旨公表していたが、改善された新たなCSVデータが6月30日に公開されたことが明らかになった。具体的には、半角カナだった読み仮名が全角カナへと変更されたほか、38文字を超えると分割されていたレコードを1つに統合。さらに文字コードはShift-JISからUTF-8へと変更されるなど、大幅な改善が行われている。まだ別の課題は残っているものの、従来では考えられなかった大きな進歩だ。従来の「KEN_ALL.CSV」とは別に「utf_all.csv」として提供されており、将来的にはこちらが使われていくことになりそうだ。
- 郵便番号データダウンロード(日本郵便)
https://www.post.japanpost.jp/zipcode/download.html - 郵便番号データの説明(日本郵便)
https://www.post.japanpost.jp/zipcode/dl/readme.html - 郵便局データ活用に関する取組状況(PDF)(総務省)
https://www.soumu.go.jp/main_content/000889005.pdf