bmaz / EuropressParser

Parsing d'articles de presse pour extraire le contenu

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

EuropressParser

Parsing d'articles de presse pour extraire le contenu et le transformer en des formats d'analyse comme TXM ou Iramuteq

Installation basique

python setup.py install

Usage basique

from europarser import process

res = process("<html> Valid HTML Europress string ... </html>", output="txm")

Autres usages

Voir dans le dossier examples

Installation sous forme d'API

  1. Installer tout d'abord comme pour l'installation basique
  2.  pip install -r requirements-api.txt
  3.  uvicorn europarser_api.api:app --reload
  4. Aller sur localhost:8000

About

Parsing d'articles de presse pour extraire le contenu


Languages

Language:Python 80.4%Language:HTML 17.5%Language:Shell 2.0%Language:Procfile 0.1%