niazerooz-extractor
extract information from https://www.niazerooz.com/ website // استخراج اطلاعات از سایت https://www.niazerooz.com/ نیازه روز
before run script
please before run the script first install the requiremets : scrapy and requests
what page's link is valid
the pages that have posts on it and at the last of the page has pagination .
like this :
run the script
you can run script with run `python main.py` ![](https://github.com/iamAmirrezaSaki/niazerooz-extractor/blob/master/screenshots/checkresult.jpg)
result.html
the result.html is looks like:
قبل از اجرا کردن کد
لطفا قبلا اجرا کردن کد ابتدا نیازمندی های آن که شامل دو کتابخونه هستش رو نصب کنید
چه لینک هایی مجاز هستند ؟
لینک صفحه ی ورودی باید دو ویژگی داشته باشد 1 صفحه دارای پست باشد و 2 انتهای صفحه صفحه بندی موجود باشد
مانند انچه در تصویر زیر میبینید
نحوه ی اجرای کد
برای اجرای کد کافیست کد python main.py
رو در ترمینال وارد کنید که دو ورودی ازتون میگیره 1 لینک صفحه و 2 تعداد صفحاتی که میخوایید اطلاعات ازشون استخراج بشه
نتیجه نهایی
نتیجه نهایی کد در فایل result.html ذخیره شده و ظاهر آن به شکل زیر میباشد :