andrewsmedina / tomba

Identifique endereços, bairros e outras localizações brasileiras em um texto 🏘

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

tomba

Built with spaCy CI PyPI version

Identifique endereços, bairros e outras localizações brasileiras em um texto. 🏘

Não sabe o que é o Tomba?


⚠️️ Essa biblioteca é experimental e está no seu estágio inicial de desenvolvimento.

Objetivo:

import tomba


tomba.get_locations(
    "Contratação de empresa de engenharia para executar obras "
    "de pavimentação localizados no CEP 44100-000, no bairro Tomba."
)

Saída:

[
    {"type": "zipcode", "start": 92, "end": 123},
    {"type": "neighborhood", "start": 113, "end": 118}
]

Suportando atualmente:

Endereços

  • Endereços
  • Bairros
  • CEPs
  • Coordenadas
  • Cidades
  • Estados

Desenvolvimento

Utilizamos o poetry para empacotamento e gerenciamento das dependências.

Para instalar as dependências, execute poetry install.

Para configurar o spacy em português, execute:

poetry run python -m spacy download pt_core_news_sm

Para rodar os testes:

poetry run pytest

Para gerar um novo modelo:

poetry run python tomba/models.py

About

Identifique endereços, bairros e outras localizações brasileiras em um texto 🏘

License:MIT License


Languages

Language:Python 62.4%Language:Jupyter Notebook 37.6%