lakk-wolof
Ce répertoire contient un ensemble de fichiers wolofs (audio et textes) open. Il a pour objectif d'aider ceux qui étudient le wolof avec le TALN.
- Le dossier teerei représente un ensemble de livres (32 fichiers pour être précis) écrit en wolof que nous avons récupéré et transormé en fichier texte grâce à BeautifulSoup et tika.
- Le dossier "liggey bu tax gnou am xibaar yi" contient les codes sources de scraping qui ont permis d'obtenir ces données
- Les autres dossiers ont des noms de personne et contiennent des sous dossiers qui contiennent chacun (un fichier audio et un fichier texte) de la personne concernée.
- Tous les documents ont été collectés depuis le site https://jangwolof.com/kaggu/
- Au total il y a 148 fichiers (32 livres, 58 audios et 58 translations audio)
- Ceci n'est que le début d'un travail et par conséquent peut être amélioré et modifié
- Toutes suggestions, apports, modifications, conseils sont les bienvenues.