TheGravityZero / news-classification

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

news-classification

Задача: Найти в большом потоке новости, в которых есть информация о событии.

Дано:

  • Обучающая выборка train_data.csv
  • Новостной поток за несколько дней test_data.csv

Основная задача новостного мониторинга -- обрабатывать входящий поток новостей, находя в них интересные пользователям события. В задании предлагается построить модель для выявления в новости события, соответствующего задержке ввода некоторого объекта в эксплуатацию.

Структура train_data.csv:

  • id - единица данных
  • sentence - текст
  • label - включает ли текст требуемое условие

Структура test.csv:

  • id - единица данных
  • title - заголовок
  • text - содержание

Ссылка на данные: https://drive.google.com/drive/folders/1BE93NbJ31zthl_HQkb5vCQwbrCY_YzOQ?usp=sharing

About


Languages

Language:Jupyter Notebook 100.0%