bbalet / stopwords

Removes most frequent words (stop words) from a text content. Based on a Curated list of language statistics.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Chargement des stop word à partir d'un fichier.

LeMoussel opened this issue · comments

Bonjour Jacques, Comme je pense que tu es français, je me permets d'écrire cette "issue" in french !

Afin de procéder a des tests sur l'utilisation de stops words sur différents textes, la liste de stop words est stocké dans un ficher comprenant un stop word sur chaque ligne. Ainsi cela me permet de tester sans recomplier.

Il serait donc intéressant d'avoir une fonction avec le chemin du fichier de stop word a charger en lieu et place du code de langue. par ex. CleanStringFile(content string, fileName string, cleanHTML bool))

Implemented by a6a1721