Ce projet a été initié par l'équipe du laboratoire IDHN (CY Cergy Paris Université). Il regroupe plusieurs outils et algorithmes développés en Python pour faire des analyses textuelles en français.
Pour installer la librairie, assurez-vous d'avoir une version de Python >=3.6, puis lancez la commande suivante :
pip install texto
Une fois installée, lancez la commande suivante pour lancer l'application :
texto install
Pour les développeurs souhaitant prototyper ou ajouter leurs algorithmes, il est conseillé de forker ce référentiel, de le cloner, de créer une branche spécifique à votre algorithme, d'effectuer vos modifications dans le code et de faire un pull request sur notre dépôt. Avant ça, il est fortement recommandé de créer une issue pour discuter des algorithmes que vous souhaitez ajouter ou améliorer.
-
Générateur de concordancier (Jérémy Demange)
-
Dispersion du discours (Jérémy Demange)
-
Fréquence des termes (Jérémy Demange)
-
RAMER - Algorithme de topics issu du langage d'indexation RAMEAU de la BNF (Jérémy Demange)
-
Reine - Algorithme semblable à Reinette et Reinert dans Iramuteq (Jérémy Demange)
-
Topic Modeling - Algorithme utilisatant l'allocation de Dirichlet latente (Jérémy Demange)
Pour toute utilisation de nos algorithmes, merci de citer les auteurs dans d'Ă©ventuelles publications.