theN0b0dy / niazerooz-extractor

extract information from https://www.niazerooz.com/ website // استخراج اطلاعات از سایت https://www.niazerooz.com/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

niazerooz-extractor

extract information from https://www.niazerooz.com/ website // استخراج اطلاعات از سایت https://www.niazerooz.com/ نیازه روز

before run script

please before run the script first install the requiremets : scrapy and requests

the pages that have posts on it and at the last of the page has pagination .
like this :

run the script


you can run script with run `python main.py` ![](https://github.com/iamAmirrezaSaki/niazerooz-extractor/blob/master/screenshots/checkresult.jpg)

result.html

the result.html is looks like:

قبل از اجرا کردن کد

لطفا قبلا اجرا کردن کد ابتدا نیازمندی های آن که شامل دو کتابخونه هستش رو نصب کنید

مانند تصویر زیر :

چه لینک هایی مجاز هستند ؟

لینک صفحه ی ورودی باید دو ویژگی داشته باشد 1 صفحه دارای پست باشد و 2 انتهای صفحه صفحه بندی موجود باشد

مانند انچه در تصویر زیر میبینید

نحوه ی اجرای کد

برای اجرای کد کافیست کد python main.py رو در ترمینال وارد کنید که دو ورودی ازتون میگیره 1 لینک صفحه و 2 تعداد صفحاتی که میخوایید اطلاعات ازشون استخراج بشه

نتیجه نهایی

نتیجه نهایی کد در فایل result.html ذخیره شده و ظاهر آن به شکل زیر میباشد :

About

extract information from https://www.niazerooz.com/ website // استخراج اطلاعات از سایت https://www.niazerooz.com/


Languages

Language:Python 100.0%