geolonia / japanese-addresses

全国の町丁目レベル(277,191件)の住所データのオープンデータ

Home Page:https://geolonia.github.io/japanese-addresses/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

latest.csv の「志喜屋」を小字に持つデータが重複している。

champierre opened this issue · comments

バグの内容

  • latest.csv の「志喜屋」を小字に持つデータが重複している。

再現手順

% cat data/latest.csv| grep '志喜屋'
"47","沖縄県","オキナワケン","OKINAWA KEN","47215","南城市","ナンジョウシ","NANJO SHI","知念字志喜屋",,,,26.153685,127.799359
"47","沖縄県","オキナワケン","OKINAWA KEN","47215","南城市","ナンジョウシ","NANJO SHI","知念","チネンアザマ","CHINEN AZAMA","志喜屋",26.152378,127.801282

本来どう動作すべきか

どちらか一方が削除されることが望ましい。

スクリーンショット(オプション)

なし

参考情報(オプション)

なし

大字の「知念字志喜屋」を「知念志喜屋」に変換してユニークキーを作成すれば解決できるのだが、冒頭ではなく途中に登場する「字」を削除するのは「字」を含んだ通常の住所も変換してしまいかねない。