geolonia / normalize-japanese-addresses

オープンソースの住所正規化ライブラリ。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

()が含まれている住所の正規化について

jumpei-nishioka opened this issue · comments

お世話になっております。

テストコードにあった住所の1つで住所自体に()が含まれている挙動について確認させてください。
ローカルで実行した感じですとエラー等は出ないのですが後ろの)だけ正規化後の住所に残ります。
意図していない挙動だと思いますので確認よろしくおねがいします。

https://github.com/geolonia/normalize-japanese-addresses/blob/master/test/addresses.csv#L13

normalize("京都府京都市下京区忠庵町柳馬場通松原下ル(忠庵町)316").then(result => {
  console.log(result);
})
{
  pref: '京都府',
  city: '京都市下京区',
  town: '忠庵町',
  addr: ')316',
  lat: 34.998237,
  lng: 135.764028,
  level: 3
}

@jumpei-nishioka フィードバックありがとうございます!

テストに使用している住所データは、不動産会社様から提供いただいた住所でして、この例の様に一部住所としておかしなものも含まれます。
このモジュールの仕様としては、

  • 町丁目レベルまで正規化を行う
  • addr(それ以降の「番地」や「号」)については、全角半角の揺れや「123番456号」などの表記を「123-456」に統一する

が想定した仕様となっておりまして、それ以外はなるべく何もしないという方向性で考えております。
これは、この部分には建物名が入ってくる可能性もあるため、「なるべくやりすぎない」ようにしているためでして、その結果っ子の例のように ) が残ったのだと思われます。

では、実際にこれらを削除すべきかどうかということになりますが、どこまでを想定するかがむずかしいところでして、悩ましいですね。。。汗

@miya0001
ご回答ありがとうございます!
なるほど、個人的には () を完全に残す形か完全に削除する形が自然かと思い、FBさせてもらいましたが説明を聞く感じですとエッジケースなので対応しなくても大丈夫な気がしてきました・・・!
issue については Closeしても問題ありません。お騒がせしました。