Zusammenfassung
If programming is magic, then web scraping is wizardry (Mitchell 2015: vii)
Der Workshop hat das Ziel die Teilnehmenden in die 'arkane' Kunst des Web Scraping einzuführen. Hierzu werden wir uns zunächst mit der Grundstruktur von Webseiten auseinandersetzen. Wichtige Grundlagen sind hier HTML, CSS und JavaScript. Im Anschluss wird ein Schema vorgestellt und erarbeitet, welches sich für die Umsetzung eines Web Scraping-Projektes eignet. Anhand mehrerer Beispiele soll dieses Schema mit Hilfe der statistischen Programmiersprache R umgesetzt werden. Im Anschluss an den Vortrag werden einige "hand-on"-Übungen die erlernten Techniken zur Anwendung bringen.
Organisation
Prof. Dr. Henning Lohmann & Cathrin Ingensiep, Professur für Soziologie, insb. Methoden der empirischen Sozialforschung, Universität Hamburg
Datum/Ort
- Januar 2018, 14-18 Uhr, Universität Hamburg
Vortrag
Fabian Gülzau, Lehrbereich Makrosoziologie, HU Berlin (Website, Twitter)
Voraussetzungen
Der Kurs basiert auf der Programmiersprache R, wobei keine vertiefenden Kenntnisse vorausgesetzt werden. Wer an den späteren "hands-on"-Übungen teilnehmen möchte, sollte einen Laptop mit Internetverbindung und der aktuellen Version von R und RStudio mitbringen. Als kurze Installationsanweisung und Einführung in R empfehle ich "R for Data Science" (Wickham & Grolemund 2018). Das Buch ist kostenfrei verfügbar (Link).