thomas-rooty / webscraping

🥷🏻 Basic webscraping scripts to learn more about the thief side of things !

Repository from Github https://github.comthomas-rooty/webscrapingRepository from Github https://github.comthomas-rooty/webscraping

Note pour le formateur

ATTENTION, j'ai utilisé Brave et non Chrome, il faudra donc modifier les premieres lignes dans les fichiers doctolib.py et les notebook Jupyter :

Il suffit juste de pointer vers Chrome, ou d'enlever la ligne option.binary_location

  • doctolib.py :
    # Init webdriver
      driver_path = "./chromedriver.exe"
      brave_path = "C:\\Program Files\\BraveSoftware\\Brave-Browser\\Application\\brave.exe"
      option = webdriver.ChromeOptions()
      option.binary_location = brave_path  <-- Enlever cette ligne
      option.add_argument("--incognito")

Erreur notebook Scrapy

Attention, dans le notebook 4 pour Scrapy, certains imports ne fonctionnent pas avec Jupyter car les dossiers sont mal définis, passez directement par le projet Scrapy qui lui fonctionne !

img.png

About

🥷🏻 Basic webscraping scripts to learn more about the thief side of things !


Languages

Language:Jupyter Notebook 91.8%Language:Python 7.8%Language:HTML 0.5%