rphln / Moody

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Como executar?

O primeiro passo é criar um ambiente virtual.

python -m venv .venv
source .venv/bin/activate

Agora, podemos instalar as dependências necessárias para a ferramenta. Elas também estão listadas no arquivo pyproject.toml.

pip install -r requirements.txt

Em seguida, é necessário especificar o caminho para os conjuntos de dados do Reddit e do Telegram no arquivo moody/__init__.py:

REDDIT = Path("var/The Pushshift Reddit Dataset.zst")
TELEGRAM = Path("var/The Pushshift Telegram Dataset.zst")

Agora é possível iniciar o servidor.

uvicorn moody:app --reload --reload-dir moody --host 127.0.0.1 --port 8000

Para acessar a ferramenta, entre na página especificada.

Como treinar os classificadores?

Os classificadores podem ser treinados novamente com os arquivos disponibilizados.

python -m moody.train-sentiment-classifier
python -m moody.train-subject-classifier
python -m moody.train-toxicity-classifier

Os arquivos referentes a cada classificador estão na pasta moody.

About

License:MIT License


Languages

Language:TypeScript 67.3%Language:Python 27.3%Language:HTML 5.4%