TextGuardian — это текстовый классификатор на Python, который определяет неприемлемое содержание в предоставленных текстах. Используя модели машинного обучения, классификатор может определить, приемлем ли текст или является ли он неприемлемым. Классификатор также способен адаптироваться и обучаться на основе отзывов пользователей.
- Клонируйте репозиторий:
git clone https://github.com/Mulhern1231/TextGuardian.git
- Перейдите в директорию проекта:
cd TextGuardian
- Установите необходимые зависимости:
pip install -r requirements.txt
Перед тем как классифицировать тексты, необходимо обучить модель. Используйте свой собственный набор данных в формате CSV или предоставленные образцы данных для обучения модели.
Для обучения модели отправьте POST-запрос на /api/train/
с файлом CSV и паролем для доступа.
Запустите сервер Django с помощью следующей команды:
python manage.py runserver
-
Обучение модели:
- Метод: POST
- URL:
/api/train/
- Параметры:
password
: Пароль для доступа (например,1111
).csv_file
: Ваш CSV файл для обучения.
- Пример ответа:
{ "message": "Model trained successfully." }
-
Получение статуса текста:
- Метод: GET
- URL:
/api/text-status/
- Параметры:
text
: Текст для классификации.
- Пример ответа:
{ "status": "Приемлемый контент", "confidence": 95.23 }
- Invalid password - Пароль, предоставленный для доступа к API обучения, неверный.
- No CSV file provided - Не предоставлен CSV файл для обучения.
- Invalid CSV format - Формат CSV файла неверный или не содержит необходимых столбцов.
- No text provided - Не предоставлен текст для классификации.