swildermann / COVID-19

public accessible data for CoVid19

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Ein Zahlendreher im Datensazt von Hamburg 2020-08-17

EmTee70 opened this issue · comments

2744,Germany,Hamburg,5878,264,2020-08-17,0,0
5878 => 5887 wäre richtig,

Wäre außerdem (für mich) super, wenn es auch eine tägliche Summe für Deutschalnd gäbe.

Danke für die Daten!

Sieht für mich eher danach aus, dass die Daten zu dem Zeitpunkt noch nicht aktualisiert sind, da es gestern noch 5878 Fälle waren. Wir aktualisieren stündlich automatisiert. Ich prüfe gleich nochmal.

Ja, wenn das automatisch kommt und für Tage wo noch nichts vorliegt, der Wert des Vortrags gesetzt wird, dann ist es ganau so.
Sehe, dass es alle Bundesländer betrifft. Das hatte ich nicht geschaut, weil ich nur Hamburg einzeln herausgezogen habe.

Nachfrage: Wann liegt der Datensatz typischer Weise vor? Die Daten für heute sind ja schon unter: https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Fallzahlen.html online.

Die Daten liegen jetzt schon in der Datenbank. Wir müssten mal schauen, ob wir den Power BI Refresh Zyklus noch etwas hochdrehen.

Wäre außerdem (für mich) super, wenn es auch eine tägliche Summe für Deutschalnd gäbe.
Wo genau? Es gibt doch eine Summe für Deutschland, wenn man kein/alle Bundesländer auswählt.
image

Die CSV Dateien werden alle 30 Minuten aktualisiert. Sobald die Daten also in der Datenbank vorliegen, kann es nochmal bis zu 30 Minuten dauern, so dass die csv-Datei dann ebenfalls auf dem selben Stand ist.

Gut, und wann werden die Daten für Ihre Datenabank beim RKI normalerweise aktualisiert?
Heute noch ja nicht.

https://covid19publicdata.blob.core.windows.net/rki/covid19-germany-federalstates.csv

2739,Germany,Baden-Württemberg,38480,1859,2020-08-17,0,0
2740,Germany,Bavaria,52888,2631,2020-08-17,0,0
2737,Germany,Berlin,10238,224,2020-08-17,0,0
2752,Germany,Brandenburg,3697,169,2020-08-17,0,0
2742,Germany,Bremen,1841,56,2020-08-17,0,0
2744,Germany,Hamburg,5878,264,2020-08-17,0,0
2749,Germany,Hesse,13433,526,2020-08-17,0,0
2743,Germany,Lower Saxony,15384,656,2020-08-17,0,0
2745,Germany,Mecklenburg-Western Pomerania,972,20,2020-08-17,0,0
2748,Germany,North Rhine-Westphalia,54390,1777,2020-08-17,0,0
2750,Germany,Rhineland-Palatinate,8121,242,2020-08-17,0,0
2738,Germany,Saarland,3000,174,2020-08-17,0,0
2751,Germany,Saxony,5730,225,2020-08-17,0,0
2747,Germany,Saxony-Anhalt,2123,64,2020-08-17,0,0
2741,Germany,Schleswig-Holstein,3782,158,2020-08-17,0,0
2746,Germany,Thuringia,3496,186,2020-08-17,0,0

Die Daten für nicht aktualisierte Tage sollten lieber fehlen, als auf 0 gesetzt sein.

Die Gesamtwerte sind nicht auf 0 gesetzt sondern haben den Vor-Tages-Wert solange bis der aktuelle Tageswert bekannt ist.
Solange die Werte von heute bei der Datenquelle sich von gestern nicht unterscheiden, ist die Differenz 0 - diese weisen wir dann auch aus.

Warum gerade die aktuellen Werte fehlen, prüfe ich.

Tatsächlich liegt das Problem an der Datenquelle. Dort scheint das Update von heute nicht erfolgreich gewesen zu sein.
Da das RKI selbst keine einfach programatisch nutzbare Quelle zur Verfügung stellt, bedienen wir uns an dieser Quelle (siehe Quellcode):

"https://opendata.arcgis.com/datasets/ef4b445a53c1406892257fe63129a8ea_0.geojson"

Wir prüfen, ob wir die Abfrage abändern müssen.