El archivo
clean_data.py
implementa el algoritmo 'ngrams' para collisión
de textos, el cual es utilizado para unificar cadenas de texto que representan
la misma entidad.
Complete el código siguiendo las instrucciones que aparecen en clean_data.py
.