cyidhn / texto

📚 La librairie Python de textométrie.

Home Page:https://pypi.org/project/texto/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Texto

Ce projet a été initié par l'équipe du laboratoire IDHN (CY Cergy Paris Université). Il regroupe plusieurs outils et algorithmes développés en Python pour faire des analyses textuelles en français.

Installation

⚠️ La librairie de textométrie est actuellement en cours de développement actif et n'est pas utilisable pour le moment. Pour les développeurs Python, rendez-vous dans le dossier "prototypes" pour découvrir les algorithmes disponibles ; ceux qui seront intégrés prochainement dans la librairie texto.

Pour installer la librairie, assurez-vous d'avoir une version de Python >=3.6, puis lancez la commande suivante :

pip install texto

Une fois installée, lancez la commande suivante pour lancer l'application :

texto install

Pour les développeurs souhaitant prototyper ou ajouter leurs algorithmes, il est conseillé de forker ce référentiel, de le cloner, de créer une branche spécifique à votre algorithme, d'effectuer vos modifications dans le code et de faire un pull request sur notre dépôt. Avant ça, il est fortement recommandé de créer une issue pour discuter des algorithmes que vous souhaitez ajouter ou améliorer.

Les algorithmes en cours d'ajouts

  • GĂ©nĂ©rateur de concordancier (JĂ©rĂ©my Demange)

  • Dispersion du discours (JĂ©rĂ©my Demange)

  • FrĂ©quence des termes (JĂ©rĂ©my Demange)

  • RAMER - Algorithme de topics issu du langage d'indexation RAMEAU de la BNF (JĂ©rĂ©my Demange)

  • Reine - Algorithme semblable Ă  Reinette et Reinert dans Iramuteq (JĂ©rĂ©my Demange)

  • Topic Modeling - Algorithme utilisatant l'allocation de Dirichlet latente (JĂ©rĂ©my Demange)

Citations

Pour toute utilisation de nos algorithmes, merci de citer les auteurs dans d'Ă©ventuelles publications.

About

📚 La librairie Python de textométrie.

https://pypi.org/project/texto/


Languages

Language:Jupyter Notebook 87.1%Language:Python 12.9%