avkazmin / npa-scrape

Скрипты для парсинга текстов правовых актов

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

npa-scrape

Веб-скрейпинг (или скрепинг, или скрапинг← англ. web scraping) — это технология получения веб-данных путём извлечения их со страниц веб-ресурсов. Веб-скрейпинг может быть сделан вручную пользователем компьютера, однако термин обычно относится к автоматизированным процессам, реализованным с помощью кода, который выполняет GET-запросы на целевой сайт.

Получение docid с сайта НПА РФ

Каждый нормативный правовой акт правового портала Нормативные правовые акты Российской Федерации http://pravo.minjust.ru/ имеет свой docid - уникальный идентификатор для набора документов, полученных из общего источника (такого вида 370BA400-14C4-4CDB-8A8B-B11F2A1A2F55). Docid автоматически генерируется в каждом документе Microsoft Word. Сбор ссылок на НПА можно сделать с помощью расширения Google Chrome Instant Data Scraper https://chromewebstore.google.com/detail/instant-data-scraper/ofaokhiedipichpaobibbnahnkdoiiah?pli=1

Получение информации об актуальной редакции НПА**

Получение текста НПА по ссылке с docid НПА

http://nla-service.minjust.ru:8080/rnla-links/ws/content/act/docid.html

About

Скрипты для парсинга текстов правовых актов


Languages

Language:Jupyter Notebook 100.0%