geolonia / normalize-japanese-addresses

オープンソースの住所正規化ライブラリ。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

表記の同じ大字町丁目があった場合に正規化に失敗するケース

kamataryo opened this issue · comments

https://api.nipponsoft.co.jp/zipcode/%E6%96%B0%E6%BD%9F%E7%9C%8C%E6%96%B0%E6%BD%9F%E5%B8%82%E5%8C%97%E5%8C%BA%E6%9D%B1%E6%A0%84%E7%94%BA

950-3323 の東栄町(トウエイチョウ)は住宅地街であるが
950-3104 の東栄町(ヒガシサカエマチ)にもGoogle Mapによる登録地が存在する

〒950-3104 新潟県新潟市北区東栄町2番12
〒950-3104 新潟県新潟市北区東栄町2丁目番12

また、他にも同様のケースが存在するとのこと。

@ress997 さんにレポートいただきました。ありがとうございます!
geolonia/japanese-addresses#152 (comment)


以下のケースではトウエイチョウかヒガシサカエマチなのかが判別できていない。

input: '新潟県新潟市北区東栄町2-12'
output: {
  "pref": "新潟県",
  "city": "新潟市北区",
  "town": "東栄町二丁目",
  "addr": "12",
  "lat": 37.914304,
  "lng": 139.22484,
  "level": 3
}

これら2つを峻別する場合、アイデアとしては API のレスポンスのデータ型の変更が必要なように思われます。
e.g. 丁目のレベルを作成、一致度などの尺度を導入して「東栄町」と「東栄町n丁目」を配列で返却する、など