Data Literacy in Zeiten der Krise
Data Literacy in Zeiten der Krise
25.03.20Katharina Schüller, die Geschäftsführerin und Gründerin des Unternehmens STAT-UP, erklärt in diesem Beitrag, warum Data Literacy insbesondere in Zeiten des Corona-Virus eine wichtige Schlüsselkompetenz ist. Weiterhin gibt sie aufschlussreiche und klare Einblicke in die Notwendigkeit und Leistungsfähigkeit von erhobenen Daten und daraus resultiernden Statistiken im Kontext der Pandemie.
Der berühmte indische Statistiker C.R. Rao sagte einmal: Sicheres Wissen ist die Summe aus unsicherem Wissen und dem Wissen über das Ausmaß der Unsicherheit. Vorneweg: Auch wir Statistiker*innen wissen nicht sicher, wie sich COVID-19 entwickeln wird.
In der folgenden Einordnung der aktuell kursierenden Statistiken folge ich deshalb drei Prinzipien:
- Wir akzeptieren, dass die Aussagefähigkeit der Daten begrenzt ist.
- Wir suggerieren keine Schein-Sicherheit in den Prognosen.
- Wir wägen mögliche Erklärungen für unerwartete Entwicklungen ab, statt übereilt in Panik zu geraten oder zu entwarnen.
Wenn wir diese Prinzipien zugrunde legen, sind viele Statistiken und Medienberichte, die in den letzten Wochen rund um COVID-19 kursieren, als Unstatistiken zu qualifizieren.
Gerade in einer Krisenphase wie der jetzigen, in der wir mit unvollständigen Daten Szenariorechnungen erstellen, ist Data Literacy eine Schlüsselkompetenz. Wir wissen, dass jede unserer Modellrechnungen falsch sein muss. Trotzdem sind die Schlussfolgerungen richtig: Wenn wir es nicht schaffen, die Ansteckungsgeschwindigkeit massiv auf einen Wert zu bringen, der geringer ist als derjenige der optimistischsten Szenarien, dann wird unser Gesundheitssystem kollabieren. Denn selbst das Best-Case-Szenario ist nicht gut genug, um sorglos zu sein.
Was ist datenethisches, datenkompetentes Handeln in einer Krise?
Wir Statistiker*innen haben ein Problem. Von uns wird erwartet, dass wir die Zahlen analysieren und Prognosen daraus erstellen, aber die Zahlen sind dafür nicht geeignet, weil sie zu wenige Informationen enthalten. Sie bilden nur einen kleinen Teil der Realität ab, nämlich die schwer Erkrankten, einen Teil der leichter Erkrankten mit Symptomen und einen ganz kleinen Teil von Menschen ohne Krankheitszeichen, die getestet wurden, weil sie Verdachtsfälle waren. Ob alle anderen infiziert sind oder nicht, das wissen wir nicht und können es auch nur mehr oder weniger begründet erraten.
Wir könnten ehrlich sein und transparent kommunizieren, wie wenig wir wissen. Aber das birgt die Gefahr, dass viele Menschen die Botschaft empfangen, dass die Modellrechnungen falsch sind (weil die Wahrscheinlichkeit, dass es genauso abläuft wie im Modell, praktisch Null beträgt) und daraus ableiten, dass die empfohlenen Maßnahmen dann auch falsch sein müssen (obwohl sie wahrscheinlich notwendig und richtig sind). Je länger wir in dieser Phase der Unsicherheit sind, für umso wahrscheinlicher halte ich es, dass viele Menschen die Einschränkungen nicht mehr akzeptieren wollen. Weil sie weh tun und weil man „nichts“ sieht und weil es ziemlich unangenehm ist, nicht zu wissen, ob das Ganze noch zwei Wochen anhält, zwei Monate oder gar bis zum Jahresende.
Das ist ein großes ethisches Dilemma. Ist es besser, wir bleiben bei der Wahrheit und hoffen, dass uns Expert*innen trotzdem geglaubt wird bei der Interpretation von Unsicherheit? Oder sollten wir mehr Sicherheit suggerieren, um das Richtige zu erreichen, auch wenn wir im strengen Sinne nicht „beweisen“ können, dass es richtig ist?
Nassim Taleb, ein berühmter Risikoforscher, hat in seinem Buch „The Black Swan“ schon vor 13 Jahren prophezeit, dass wir irgendwann in einer Situation wie der jetzigen stecken würden. Er schreibt in einem aktuellen Essay, es sei klüger für den einzelnen Menschen, in Bezug auf COVID-19 übertrieben und mit einer Art Panik zu reagieren, obwohl das individuelle Risiko im Durchschnitt für jeden einzelnen von uns ziemlich klein ist. Das gilt nicht für Risikogruppen, aber für vermutlich mindestens 97% der Bevölkerung, denn aktuell scheinen in Deutschland nur 3% aller Infektionen einen schweren Verlauf zu nehmen. Aber die Dominoeffekte sind nicht abzusehen, wenn sich schlagartig sehr viele Menschen anstecken, so dass das System als Ganzes kippen kann.
Ich denke, wir Statistiker*innen haben unsere Handlungsmöglichkeiten weitgehend ausgeschöpft, was die aktuelle Datenlage angeht. Wenn es nicht bald möglich ist, repräsentative Daten zu bekommen, mit denen wir zuverlässigere Einschätzungen über die Verbreitung und die Gefährlichkeit des neuen Corona-Virus abgeben können, dann werden unsere Warnungen bald nicht mehr ernst genommen. Deswegen halte ich es für unerlässlich, dass Tests nicht nur an schweren Fällen und prominenten Verdachtsfällen durchgeführt werden, sondern an repräsentativen Bevölkerungsstichproben. Nur wenn wir deutlich mehr und systematisch testen, schaffen wir die Möglichkeit, dass wir stufenweise zu einem einigermaßen normalen Leben zurückzukehren und damit die negativen sozialen und wirtschaftlichen Konsequenzen dieser Pandemie einigermaßen begrenzen.
Wie verlässlich sind die Datengrundlagen?
Die Zahl der getesteten Infizierten hat nur bedingt etwas mit der Zahl der tatsächlichen Infizierten zu tun. Diese Hypothese lässt sich sachlogisch begründen, weil Menschen mit wenigen oder gar keinen Symptomen in den seltensten Fällen getestet wurden und werden, insbesondere nicht, wenn sie keinen Kontakt zu nachweislich Infizierten hatten. Erst mit der Entwicklung schnellerer Testverfahren, die vor wenigen Tagen erstmals in Deutschland zum Einsatz kamen, wird es möglich, systematisch und unverzerrt zu testen. Die Fallzahlen hängen also massiv davon ab, wie intensiv in den unterschiedlichen Regionen getestet wird. Dies zeigen nicht zuletzt die riesigen Unterschiede in den Sterberaten.
In den statistisch erfassten Verläufen ist zu erkennen, dass Länder, die systematisch und (eher) repräsentativ testen, ein stabiles Verhältnis der Todesfälle zu den bestätigt Infizierten aufweisen. Dabei ist es nicht sinnvoll, die heute bestätigten Infektionsfälle als Referenz zu verwenden, vielmehr sind die bestätigten Fälle der infizierten Kohorte, aus der die mutmaßlichen Todesfälle stammen, die richtige Vergleichsgruppe.
Wird der Zeitverzug nicht beachtet und werden stattdessen die kumulierten Todesfälle durch die kumulierten bestätigten Fälle geteilt, dann sind die Schätzungen der Tödlichkeit von COVID-19 erheblich nach unten verzerrt. Deshalb war eine Todesfall-Rate von knapp 0,2%, wie sie bis vor einigen Tagen noch vom Geo Health Centre der Universität Bonn im Esri Corona Dashboard berechnet wurde, irreführend.
Wird allerdings die Dunkelziffer nicht berücksichtigt, dann ist die geschätzte Letalität – d.h. der Anteil der Todesfälle an allen neu Infizierten – systematisch zu hoch.
Der Abgleich der Zeitreihen von bestätigten Infektionen und Todesfällen aus China und Deutschland lässt den Schluss zu, dass etwa 11 Tage Verzug das stabilste Verhältnis liefern, d.h. dass es am plausibelsten ist, den Anteil der Todesfälle an der Zahl der bestätigten Fälle 11 Tage zuvor zu berechnen.
Die Zahl der Toten wird fast überall vollständiger sein als die der Infizierten, die eine hohe Dunkelziffer aufweisen. Allerdings gibt es ein „Land“, das Kreuzfahrtschiff „Diamond Princess“, bei dem von einer vollständigen Erfassung der Infizierten auszugehen ist, weil alle Passagiere getestet wurden. Zwar sind die Passagiere eines Kreuzfahrschiffs älter als die Durchschnittsbevölkerung, aber diese Altersverschiebung können Statistiker*innen herausrechnen. Aus den Daten der „Diamond Princess“ ergibt sich nach einer Altersstandardisierung dann eine Letalität von COVID-19, die bei 0,5% liegt – mit einer Unsicherheit, die etwa bei +/- 50% liegt.
Dieses rechnerische Ergebnis deckt sich mit der Einschätzung des Virologen Christian Drosten, der die Letalität auf 0,3% bis 0,7% schätzt.
Wie exakt sind die Prognosen und welchen Effekt können wir von Social-Distancing-Maßnahmen erwarten?
Die Entwicklung der Infektionen hängt im Wesentlichen von drei Annahmen ab: Erstens, wie viele Menschen eine infizierte Person ansteckt. Zweitens, wie lange eine infizierte Person ansteckend ist. Drittens, ob Immunität eintritt.
Alle diese Annahmen sind unsicher. Statistik/Epidemiologie und virologische Expertise sind gleichermaßen vonnöten, um aus den Daten zumindest grobe Schätzungen zu erhalten und die Krankheitsverläufe zu beurteilen. Häufig ist zu lesen, dass ein (unerkannt) Infizierter innerhalb von 5 Tagen zwei bis drei weitere Personen anstecken würde, wenn er seine sozialen Kontakte wie bisher pflegt. In einer Modellrechnung, die vom Bundesministerium für Gesundheit unter dem Hashtag #wirbleibenzuhause in den sozialen Medien verbreitet wurde, ist ein sogenannter Reproduktionsfaktor von 2,5 Ansteckungen pro Infiziertem angenommen, bis dieser nach 5 Tagen in Quarantäne geht. Das würde rechnerisch zu 406 Infizierten nach 30 Tagen führen. Liegt der Reproduktionsfaktor jedoch tatsächlich bei 2 oder bei 3, dann liegt die Anzahl der Infizierten nach 30 Tagen zwischen 129 und 1010, also um ein Mehrfaches darüber oder darunter.
Wieviele Fallzahlen also in den nächsten Tagen zu erwarten sind, das lässt sich nicht einmal annähernd verlässlich prognostizieren. Dazu sind die Spannbreiten, innerhalb derer die unbekannten Parameter liegen können, viel zu groß. Die Wachstumsrate, über deren absolute Höhe man nur spekulieren kann, spielt dabei eine erheblich größere Rolle als die beobachteten Fallzahlen zu einem bestimmten Zeitpunkt.
Der Grund für den enormen Einfluss der Wachstumsrate liegt in der exponentiellen Ausbreitung. Wenn die Zahl der Infizierten in einer gegebenen Zeitspanne nicht um einen festen absoluten Betrag wächst, sondern sich um einen bestimmten Faktor vervielfacht, dann spricht man von exponentiellem Wachstum. Exponentielles Wachstum bedeutet also, dass sich die Zahl der Infizierten in einem bestimmten Zeitraum verdoppelt.
So würden aus 10.000 Infizierten innerhalb von sieben Verdopplungs-Zyklen bereits 1,2 Millionen Infizierte, nach weiteren drei Zyklen wären es über 10 Millionen. Exponentielles Wachstum führt rasch zu extrem großen Zahlen, selbst wenn die Ausgangsbasis klein ist. Wenn deshalb nicht auf Dauer verhindert werden kann, dass sich Menschen anstecken, so ist es zumindest sinnvoll, die Ausbreitungszeit zu verlangsamen.
Dies ist der Hintergrund der Überlegung, dass eine Verringerung der sozialen Kontakte auch zu einer Verlangsamung der Ausbreitung von COVID-19 führt, und zwar ebenfalls überproportional. 50% weniger Kontakte verringern in der obigen Modellrechnung die Zahl der tatsächlich Infizierten nach 30 Tagen im Mittel um 96%, 75% weniger Kontakte sogar um 99,4%.
Allerdings täuscht jede Prognose, die keine Angaben über die Prognoseunsicherheit macht, eine Sicherheit vor, die niemand besitzt. Weder lassen die vorhandenen Daten zweifelsfreie Schlüsse auf die wahre Verbreitung oder Ausbreitungsgeschwindigkeit des Corona-Virus zu, noch sind die Auswirkungen verschiedener Maßnahmen klar bezifferbar.
Wie sind die Zahlen und Prognosen zu interpretieren und was bedeutet es, wenn trotz Maßnahmen die Fallzahlen weiter steigen?
In den letzten Tagen sind die Schlagzeilen von der Meldung dominiert, dass die Fallzahlen viel stärker steigen würden als erwartet. Einer solchen Erwartung liegen allerdings Annahmen zugrunde, die wir eben dargestellt haben. Dabei spielt es eben nicht nur eine Rolle, ob die Annahmen zum Zeitpunkt der Prognose zutreffend waren, sondern auch, ob sie nach wie vor zutreffen.
Ändert sich der Anteil der bestätigten Fälle an allen Infizierten, d.h. den bestätigten und der Dunkelziffer, dann können Fallzahlen steigen oder sinken, auch wenn das unterstellte Modell nach wie vor gilt. Die beobachteten Fallzahlen lassen dann keine Rückschlüsse darauf zu, ob die Annahmen über die Ansteckungsraten korrekt waren oder nicht. Deshalb sind Mutmaßungen wie im Focus zu den gestiegenen Fallzahlen der letzten Tage aus unserer Sicht als Fehlschlüsse zu betrachten:
Durch Inkubationszeit, Test- und Auswertungsdauer, etc. gehen die heutigen Fallzahlen auf Infektionen von vor 5-10 Tagen zurück. Am Montag wurde allerdings ein neues, schnelleres Testverfahren (CDC-Test) vorgestellt. Mit gutem Grund lässt sich annehmen, dass damit die Test- und Auswertungsdauer in den letzten 2-3 Tagen beschleunigt wurde und allein deshalb die Zahl der bestätigten Fälle vorübergehend ansteigt – ein Effekt, der sich durchaus mit den Auswirkungen des „Doppelabiturs“ nach Einführung von G8 vergleichen lässt.
Immer wieder werden in der Berichterstattung die aktuellen Maßnahmen den Fallzahlen gegenübergestellt („trotz der verschärften Maßnahmen sind die Fallzahlen auch gestern weiter gestiegen“, u.a. im heute journal oder ähnlich auch bei Spiegel Online). Ob die verschärften Maßnahmen wirken, können wir aber vermutlich erst in 1-2 Wochen beurteilen. Insofern muss der Politik die Zeit gegeben werden, den Erfolg der Maßnahmen zu evaluieren.