Fuenfgeld / 2022TeamADataEngineeringBC

This is a repository for a Data Engineering Tutorial

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Übung Daten transformieren

niklasbuechner opened this issue · comments

Ich habe mal für die Geschichte in die anderen Abschlussprojekte reingeschaut und mal geschaut, was wir alles inhaltlich im Tutorial haben sollten. Dort sind folgende Datentransformationen vorhanden:

  • Mehrere Tabelle an einander anfügen
  • Inhalte einer Zelle ändern (z.B. ein Datum aus der Textform in ein Python Datumsobject umwandeln -> z.B. mit Lambdas)
  • Einen neue Spalte hinzufügen basierend auf den anderen Spalten (z.B. Alter aus Geburtsdatum und Todesdatum berechnen)
  • Spalten aufräumen (z.B. Zeilen löschen, die in bestimmten Spalten Nullwerte beinhalten)
  • Spalten umbenennen
  • Spalten löschen
  • Daten zusammen führen (z.B. Namen aus einer Tabelle und deren Krankheiten aus einer anderen Tabelle an Hand der Patienten Id zu einer Tabelle zusammenfügen)