Parsing d'articles de presse pour extraire le contenu et le transformer en des formats d'analyse comme TXM ou Iramuteq
python setup.py install
from europarser import process
res = process("<html> Valid HTML Europress string ... </html>", output="txm")
Voir dans le dossier examples
- Installer tout d'abord comme pour l'installation basique
-
pip install -r requirements-api.txt
-
uvicorn europarser_api.api:app --reload
- Aller sur localhost:8000