Fuenfgeld / DMA2023TeamB

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

ANTICOVIS - Anticoagulation impact on COVID-19 disease severity

Direktverlinkung zu zentralen Elementen des Projekts

Einleitung

ANTICOVIS ist ein Datenmanagement-Projekt im Rahmen des Zertifikatskurses Datenmanagement und Archivierung im Umfeld der Forschung, welcher als Modul in den berufsbegleitenden Masterstudiengang Biomedizinische Informatik und Data Science der Hochschule Mannheim in Kooperation mit dem MIRACUM-Konsortium und der Graduate School Rhein Neckar integriert ist.

ANTICOVIS basiert auf Patient:innendaten, die durch Synthea erzeugt wurden (Walonoski et al. 2017). Das Projekt hat zum Ziel, ausgehend von erhobenen Quelldaten, den Prozess von Sichtung dieser und einer Formulierung von Fragestellungen bzw. Hypothesen über eine Datenverarbeitung bis hin zur Analyse sowohl in Form von Codes, als auch in Form einer dezidierten und klar nachvollziehbaren Dokumentation darzustellen.

Das Projekt orientiert sich dabei an der Data Roadmap nach Briney et al., welche 2015 im Buch "Data Management for Researchers" erstmals vorgestellt wurde. Sie beschreibt den Lebenszyklus der Daten, beginnend von der Planung über Datenverarbeitung und -auswertung, lässt dabei die zunehmend wichtiger werdenden Aspekte einer Langzeitaufbewahrung und Nachnutzbarkeit nicht außer acht. Diese Elemente sind in unserem Wiki, wie nachfolgend diskutiert, nachvollziehbar dokumentiert.

Data Roadmap

Dokumentation der Codes

Im obenstehenden GitHub Repository des Projekts sind die Codes des Projekts zum Aufbau einer initialen SQL-Datenbank, dem ETL-Prozess mit Aufbau eines Datawarehouses sowie der Auswertung der in das erstellte Datawarehouse geladenen Daten aufgelistet.

Dokumentation des Projekts im ANTICOVIS Wiki

Das ANTICOVIS-Wiki ist für eine intuitive Einsicht von Sekundärnutzer:innen und Interessierten gemäß unseres Vorgehens im Rahmen des Moduls Datenmanagement und Archivierung aufgebaut:

  1. Datenmanagementplan

  2. Datenschutzfolgeabschätzung

  3. Planungs- und Datenerhebungsphase: Beschreibt unsere initiale interne Quelldatensichtung und darauf basierende Formulierung von Forschungsfrage bzw. Hypothesen.

  4. Quelldatenverarbeitungs- und Datenbankerstellungsphase: Beinhaltet hochrelevante Überlegungen vor der eigentlichen Datenverarbeitung ergänzend zu dem oben aufgeführten Datenmangementplan und der Datenschutzfolgeabschätzung zu unserer Datenbankerstellung aus selektierten Synthea-Quelldaten.

  5. ETL-Prozess und Data Warehouse-Erstellung: Diese umfasst den ETL-Prozess des ANTICOVIS-Projekts. Oben beschriebene Quelldaten werden exploriert und hinsichtlich ihrer Datenqualität analysiert. Es werden das Star-Schema sowie die Verwendung externer Daten (MED_Classification und COV_Grading), "Pseudonymisierung" sowie die Implementierung der Mapping-Tabellen in das ANTICOVIS Data Warehouse beschrieben.

  6. Datenauswertungsphase: Überlegen zielführender Analysepfade und Exploration von Methoden, diese zu realisieren. Ebenfalls werden in unserem Wiki die hieraus resultierenden Ergebnisse beschrieben.

  7. Projektübersicht: Nach Abschluss der Phasen soll eine um- und zusammenfassende Übersicht des gesamten Prozesses (Datenflussdiagramm), unserer Codes (Übersicht GitHub Repository) sowie unserer benutzten Methoden (Systemumgebung) erstellt werden. Ferner sind hier zentrale Ausführungen zu Data Sharing, Access Management und Archivierung zu hinterlegen.

Visuelle Projektzusammenfassung

Untenstehend ist die visuelle Projektzusammenfassung von ANTICOVIS zu finden. Im ANTICOVIS-Wiki sind projektspezifische technische Details, Datenmanagementplan sowie Forschungsergebnisse aufgeführt.

Visuelle Projektzusammenfassung von ANTICOVIS

Projektübersicht

About

License:Apache License 2.0


Languages

Language:Jupyter Notebook 100.0%