Skrapivn / scrapy_parser_pep

Асинхронный парсер документов PEP на базе фреймворка Scrapy.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Асинхронный парсер PEP

Парсер документов PEP на базе фреймворка Scrapy.

Описание

  • Собирает номер, название и статус всех PEP.
  • Подсчитывает общее количество каждого статуса, а также общую сумму всех статусов.

Парсер собирает данные с сайта https://www.python.org/

Вся собранная информация сохраняется в файлах csv в папке results/...

Как запустить проект

  1. Клонировать репозиторий:
git clone https://github.com/Skrapivn/scrapy_parser_pep.git
  1. Создать виртуальное окружение:
python -m venv venv
  1. Активировать виртуальное окружение, обновить версию pip и установить зависимости из requirements.txt:
source venv/bin/activate
python -m pip install -upgrade pip.
pip install -r requirements.txt
  1. Запустить в консоле:
scrapy crawl pep

⬆Оглавление

Sergey K.

About

Асинхронный парсер документов PEP на базе фреймворка Scrapy.

License:MIT License


Languages

Language:Python 100.0%