latest.csv の「志喜屋」を小字に持つデータが重複している。
champierre opened this issue · comments
バグの内容
- latest.csv の「志喜屋」を小字に持つデータが重複している。
再現手順
% cat data/latest.csv| grep '志喜屋'
"47","沖縄県","オキナワケン","OKINAWA KEN","47215","南城市","ナンジョウシ","NANJO SHI","知念字志喜屋",,,,26.153685,127.799359
"47","沖縄県","オキナワケン","OKINAWA KEN","47215","南城市","ナンジョウシ","NANJO SHI","知念","チネンアザマ","CHINEN AZAMA","志喜屋",26.152378,127.801282
本来どう動作すべきか
どちらか一方が削除されることが望ましい。
スクリーンショット(オプション)
なし
参考情報(オプション)
なし
大字の「知念字志喜屋」を「知念志喜屋」に変換してユニークキーを作成すれば解決できるのだが、冒頭ではなく途中に登場する「字」を削除するのは「字」を含んだ通常の住所も変換してしまいかねない。