Von solchen und anderen Zahlen. Die besondere Rolle der Statistik in der Corona-Krise. Zugleich ein Spiegelbild des Spannungsverhältnisses von Erwartungen an und der eigenen Logik der Wissenschaften

Es ist – eigentlich – noch nicht wirklich lange her, dass die Corona-Krise über uns gekommen ist. Erst ab Mitte März hat das Virus unsere Gesellschaft zumindest in der Berichterstattung vollständig infiziert. Und wahrscheinlich auch wegen der unglaublich dichten, jede Stunde des Tages beherrschenden Berichterstattung rund um dieses Thema fällt es un s gar nicht so einfach, zurückzudenken an die Tage vor einigen Wochen.

Aber eines kann man für diese Zeit sicher unzweifelhaft sagen: Wie gebannt haben alle auf Zahlengebilde und Abbildungen gestarrt, was ansonsten wenn überhaupt, dann einigen wenigen Wissenschaftlern und Fachexperten vorbehalten war (und in der „neuen“ Normalität wieder sein wird). Die tagtäglich verkündeten Fallzahlen wurden aufmerksam registriert – auch vor dem Hintergrund der Bilder, die uns zu der gleichen Zeit aus Italien erreichten, unfassbare Bilder völlig überlasteter Krankenhäuser und unzähliger Särge, die in Kirchen gestapelt oder von Militär-Lastwagen abtransportiert wurden.

Ich halte die Annahme für plausibel, dass auch und gerade diese Bilder aus der täglichen Dauer-Berichterstattung zum einen die (anfangs) hohe Akzeptanz für die dann erfolgten massiven Einschränkungen des individuellen und gesellschaftlichen Lebens („Shutdown“, „Lockdown“) hervorgerufen haben – zugleich wurde der ganzen Apparat des deutschen Krankenhaussystems mit Blick auf eine Vorbereitung auf eine von vielen als Schreckensszenario in den Raum gestellte große Welle an COVID-19-Patienten in Bewegung gesetzt. Sogenannte planbare Operationen wurden nicht mehr durchgeführt und alles dem Ziel, ähnliche Überlastungskatastrophen wie in Bergamo oder dem französischen Elsass zu vermeiden, was bislang auch sehr gut funktioniert hat.

Zurück zu der angesprochenen Zahlenfixierung – durchaus verständlich, denn Statistiken symbolisieren eine gewisse Beherrschbarkeit der Situation im Sinne ihrer Erfassung und Darstellung, zugleich bedienen die präsentierten Zahlen je nach Verlauf Zuversicht oder Panik.

Zugleich aber ist – das wissen Sie sicherlich – mit Zahlen, vor allem vielen zahlen, immer auch die Gefahr verbunden, dass man den Wald vor lauter Bäumen nicht mehr sieht und/oder dass die Zahlen und deren Abbildung falsch interpretiert werden, weil keine notwendigen Relationen hergestellt werden (können). Schauen Sie sich bitte als ein Beispiel dazu die folgende Abbildung an:

Quelle der Abbildung: FAZ, 18.04.2020

Dargestellt sind die Verläufe absoluter Zahlen – aber jeder weiß (eigentlich), dass es zwischen den hier dargestellten Ländern allein hinsichtlich der Bevölkerungsgröße ziemliche Unterschiede gibt.

Quelle: Corona-Infizierte – Veränderung gegenüber dem Vortag – Stand: 09. Mai, AW-Wiki, Abruf am 09.05.2020

Aber was sagen solche Zahlen wie die der Neuinfektionen eigentlich aus? Erst einmal nur, wie viele derjenigen, die getestet wurden, einen positiven Befund bekommen haben. Und schon öffnet sich ein ganzer Reigen an notwendigen Differenzierungen: Wenn jemand positiv getestet wurde, bedeutet das nicht auch zwangsläufig, dass dieser Mensch auch erkrankt ist oder noch erkranken, geschweige denn ein Behandlungsfall für das Krankenhaus werden wird. Außerdem stellt sich natürlich sofort die Frage, wer denn eigentlich getestet wurde – und wer nicht? Also wie eng oder weit ist die Auswahl der Getesten? Zugespitzt formuliert: Wenn kaum getestet wird, hat man auch wenig Neuinfizierte. Nun könnte man sagen, dass das spätestens dann auffällt, wenn die Betroffenen in die Klinik kommen (müssen). Aber was, wenn es – wie viele? – Infizierte gibt, bei denen die Infektion zu einem nur milden oder gar einem symptomfreien Verlauf führt? Das wiederum wäre wichtig zu wissen, um ein- und abschätzen zu können, in welchem Ausmaß aus den Infektionen auch behandlungsbedürftige Fälle werden.

Hier geht es offensichtlich um die „Dunkelziffer“ bei den Infektionen. Dazu dieser Beitrag:
➔ Deutschlandfunk: Die Rolle der Dunkelziffer bei Covid-19: „Zahlen sind wichtig, aber kein allwissendes Orakel“, sagte Wissenschaftsredakteur Volkart Wildermuth. Denn auf die offiziellen Zahlen der mit dem Coronavirus infizierten Menschen kann man sich nicht ausschließlich verlassen. Die Dunkelziffer spielt noch eine zu große Rolle bei den Prognosen.
Das hier angesprochene Problem wurde in den vergangenen Wochen intensiv diskutiert – und die Debatte verdeutlicht die zahlreichen methodischen Fallstricke, die man bedenken muss. Eine Auswahl aus der Berichterstattung dazu:
Weltweit könnte es zehn Mal so viele Corona-Infizierte geben: Göttinger Forscher vermuten sogar, dass bisher im Durchschnitt nur sechs Prozent der Infektionsfälle nachgewiesen wurden. Andere finden diese Schätzungen zu hoch. Nun sollen die richtigen Zahlen ermittelt werden, zumindest für Deutschland.
Hochrechnung sieht nur sechs Prozent der weltweiten Corona-Fälle erfasst: Mehr als 1,3 Millionen Menschen weltweit haben sich nachweislich mit dem Coronavirus infiziert. Nun zeigt eine aktuelle Studie: Die tatsächliche Zahl dürfte deutlich höher liegen, auch in Deutschland. Die Studie, die hier angesprochen wurde, finden Sie im Original hier: Christian Bommer and Sebastian Vollmer (2020): Average detection rate of SARS-CoV-2 infections is estimated around six percent, Göttingen 02.04.2020.
Charité-Forscher zu Corona: „Wir stochern immer noch im Nebel“: Robuste Daten über Covid-19 sind rar, sagt Ulrich Dirnagl, Experte für die Qualität biomedizinischer Forschung. Es sei höchste Zeit für Evidenz, mahnt er. Sie könne einen Weg aus der Krise weisen.

Wenn man das alles nachzuvollziehen versucht, dann wird man schon gehörig unsicher werden, was die Qualität und Aussagefähigkeit der Daten angeht, mit denen wir es in den vergangenen Wochen zu tun hatten und immer noch haben. Und das geht nicht nur uns so, sondern auch den politischen Entscheidungsträgern. Ein echtes Problem. Dazu dieser Artikel von Anfang April: Bei den Corona-Zahlen stehen alle im Dunkeln: »Daten zu Corona-Infektionen, Todesfällen und Ausbreitung sind durchwegs unzuverlässig. Das stürzt die Politik in ein Dilemma, denn sie muss auf Basis solcher Zahlen handeln.«

Dazu auch dieser Beitrag: „Die Zahlen sind vollkommen unzuverlässig“: »Wie gefährlich das Coronavirus ist, wissen Experten noch immer nicht genau. Hier erklärt der Statistikexperte Gerd Antes, was nun für eine Risikobewertung nötig ist und warum die Reaktion der Politik bislang richtig war.« Also auf der einen Seite die Darstellung der Unvollständigkeit und der Unsicherheiten hinsichtlich des Datenmaterials, auf der anderen Seite aber äußert der Statistik-Experte auch großes Verständnis für die einschneidenden Maßnahmen, die seitens der Politik „sicherheitshalber“ (?) verhängt wurden.
➞ Übrigens: Der gleiche Experte hat sich nun auch ganz aktuell erneut zu Wort gemeldet in einem Radiointerview – und sich da kritisch zu den derzeit im Stundentakt purzelnden Lockerungen geäußert. Das Interview mit ihm kann hier als Audio-Datei abgerufen werden: Statistikexperte: „Wir schauen nicht mehr auf die Zahlen“ (08.05.2020): »Die Politik hat nach sinkenden Infektionszahlen weitgehende Lockerungen der Corona-Einschränkungen beschlossen. Der Biometriker Gerd Antes kritisiert zu schnelle Öffnungen. Man vertue die Chance, die Kontrolle über neue Infektionen zu behalten, meint der Biometriker Gerd Antes.«

Aber – so wird der eine oder andere denken – kann man dann nicht einfach zur Aufhellung der angesprochenen „Dunkelziffer“ eine repräsentative Stichprobe ziehen, um in dieser beispielsweise zu ermitteln, wie viele Menschen, die den offiziellen Tests „entgangen“ sind, in Wirklichkeit aber bereits infiziert waren? Das wäre eine überaus bedeutsame Erkenntnis, wenn man das herausbekommen könnte. Genau das haben sich natürlich auch Wissenschaftler gedacht – und zu handeln versucht.

Die „Heinsberg“- bzw. genauer: die „Gangelt“-Studie in Nordrhein-Westfalen. Zugleich ein weiteres Beispiel für die Gefahr einer Instrumentalisierung von „der“ Wissenschaft durch Politik und andere interessierte Kreise

Unter der Überschrift Tests mit Unsicherheiten schreiben Christina Berndt und Hanno Charisius: »Wissenschaft ist Wissenschaft, und Politik ist Politik. Beide funktionieren nach sehr unterschiedlichen Prinzipien. Und wenn sie zu eng miteinander sind, wird es oft schwierig – wie zuletzt der Fall Gangelt gezeigt hat. Der 12.000-Einwohner-Ort im Kreis Heinsberg in Nordrhein-Westfalen gilt als einer der Corona-Hotspots in Deutschland. Deshalb haben sich Wissenschaftler vom Universitätsklinikum Bonn daran gemacht, Fragen zur Ausbreitung und Tödlichkeit der Corona-Pandemie am Fall dieser Gemeinde zu untersuchen.« Hört sich nach einem sinnvollen Unterfangen an.

Leiter der Studie, der Aids-Experte Hendrik Streeck vom Universitätsklinikum Bonn, förderte dann auch interessante und mit Spannung erwartete Ergebnisse zu Tage: »In 400 Haushalten habe sein Team für die Studie 1.000 Personen darauf untersucht, ob sie schon immun gegen Sars-CoV-2 seien, sagte Streeck. Die Ergebnisse von 509 Personen aus 240 Haushalten seien nun ausgewertet. Das Fazit: Etwa 15 Prozent der Bürger hätten Antikörper gegen das neue Coronavirus Sars-CoV-2 gebildet, sie seien nun immun. Auf dem Weg zur Herdenimmunität, für die 60 bis 70 Prozent einer Bevölkerung Immunschutz aufgebaut haben müssen, um eine weitere Ausbreitung einer Infektion massiv einzudämmen, habe das Örtchen somit schon ein gutes Stück Weg hinter sich gebracht. Und daraus errechneten die Bonner Wissenschaftler eine weitere beruhigende Nachricht: Gestorben seien nur 0,37 Prozent der Infizierten – während die Johns-Hopkins-Universität für Deutschland bislang eine fünffach höhere Quote von fast zwei Prozent ermittelt hat.«

Und an solchen Botschaften waren auch andere höchst interessiert: Eilig wurden »am Gründonnerstag erste Zwischenergebnisse in einer Pressekonferenz in der Düsseldorfer Staatskanzlei präsentiert. Der Virologe, der zum Corona-Beraterstab von Nordrhein-Westfalens Ministerpräsident Armin Laschet (CDU) gehört, wollte, wie er betonte, erste Zahlen unbedingt noch vor der Sitzung der Ministerpräsidenten am Mittwoch bereitstellen, in der über eine Lockerung der Corona-Maßnahmen entschieden werden soll.«

Der Ministerpräsident war natürlich sehr erfreut über die „Zwischenergebnisse“ der Wissenschaftler um Streeck, konnte er sie doch verwenden, um für eine Lockerung der Maßnahmen zu werben. Aber das hatte schon alles mehr als das, was die Schwaben ein „Geschmäckle“ nennen. Man muss wissen: Die Studie wurde von der PR-Agentur „Storymachine“ beworben (und die Ergebnisse breit in den Medien gestreut), die der ehemalige Bild-Chefredakteur Kai Diekmann mitgegründet hat. Diekmann war Anfang 2019 mit einer anderen Agentur auch an einer PR-Aktion für einen angeblichen Brustkrebstest der Universität Heidelberg beteiligt, die den Ruf der Hochschule international schwer beschädigt hat, weil damals völlig voreilig und ohne wirkliche Substanz für ein Testverfahren geworden wurde, das sich dann als Fake herausgestellt hat. Für die Wissenschaft ein Super-Gau und „natürlich“ primär durch Profitinteressen getrieben. Wer garantiert im aktuellen Fall, dass nicht beispielsweise zahlungskräftige Unternehmen und Branchenvertreter, die großes Interesse an Lockerungen haben, die Einschaltung und die Arbeit der Agentur in die Wege geleitet und finanziert haben?

Doch mit der eilig anberaumten Pressekonferenz zog Hendrik Streeck viel Kritik auf sich. Gleich nach seiner Präsentation stellten andere Forscher die Aussagekraft seiner Ergebnisse in Frage. Das wurde in den Medien ziemlich breit behandelt:
Der Disput der Virologen: Der eine hat tolle News aus der Forschung im besonders vom Virus betroffenen Kreis Heinsberg. Der andere zerreißt diese Neuigkeiten in der Luft.
„Unplausible Zahlen“ – Kritik an Heinsberg-Studie: Mit viel Aufmerksamkeit wurden am Donnerstag die Zwischenergebnisse zur Heinsberg-Studie vorgestellt. Jetzt äußern Fachleute Zweifel an ihrer Aussagekraft
Kritik an Corona-Studie aus Heinsberg: Unplausible Zahlen und nicht aufs ganze Land übertragbar: Fachleute zweifeln an der Aussagekraft der Heinsberg-Studie. Sie gebe keinen Anlass, Kontaktsperren zu lockern.

Eine Zusammenfassung findet man auch in diesem Beitrag: Heinsberg-Studie: Das lernen wir daraus – und das nicht (07.05.2020).

Die „Heinsberg“- bzw. „Gangelt“-Studie im Original finden Sie hier:
➔ Hendrik Streeck et al. (2020): Infection fatality rate of SARS-CoV-2 infection in a German community with a super-spreading event, Bonn, 04.05.2020

Gerade bei der Gangelt-Studie kann man studieren, welche Bedeutung methodische Fragen haben (können): Der Epidemiologe Gérard Krause vom Helmholtz-Zentrum für Infektionsforschung in Braunschweig äußerte sich zu Aspekten der Heinsberg-Studie. Aus Haushalten könne man nicht einfach hochrechnen, warnte er. Denn ob man 1.000 Menschen aus 1.000 Haushalten untersucht oder 1.000 Menschen aus 400 Haushalten, ergibt einen Unterschied, was die Zahl der Immunisierten betrifft: Die Menschen, die in einem Haushalt leben, stecken einander schneller an als ihre Nachbarn oder Fremde. Die Zahl der Bürger, die eine Infektion bereits durchgemacht haben, könnte auf diese Art größer erscheinen, als sie in Wirklichkeit ist.

Einer der Kritiker bzw. derjenigen, die kritische Anfragen an die Gangelt-Studie vorgetragen haben, ist der mittlerweile sicherlich allen bekannt Virologe und Sars-Experte Christian Drosten von der Berliner Charité. Er hat zwei Punkte zu bedenken gegeben: Zum einen lässt sich aus der Immunität der Menschen in Heinsberg nicht einfach auf andere Regionen schließen, so Drosten. Der zweite Punkt scheint sehr speziell, ist aber nicht nur aus statistischer Sicht höchst interessant: Drosten warnte er vor Fehlschlüssen aus dem in Heinsberg verwendeten Antikörpertest. „Diese Labortests haben eine hohe Rate an falsch positiven Signalen, rein technisch“, sagte er. Denn die bislang verfügbaren Tests können Antikörper gegen das neue Coronavirus nicht sauber von Antikörpern gegen die vier gängigen Coronaviren unterscheiden, an denen in jeder Erkältungssaison zahlreiche Menschen erkranken.

Das ist ein spannender Punkt, denn der „normale“ Bürger wird sicher ob bewusst oder unbewusst davon ausgehen, man macht einen Test und dann gibt es einen klaren Befund, entweder positiv oder negativ. Außer, dass die Probe vertauscht wird, kann hier doch eigentlich nichts schief gehen. Sollte man denken. Ist aber nicht so, wie man der Andeutung von Drosten entnehmen kann.

Studienleiter Streeck widerspricht, denn »der von seinem Team verwendete Antikörpertest der Lübecker Firma Euroimmun habe laut Herstellerangaben eine Spezifität von mehr als 99 Prozent. Das bedeutet, dass bei einem Prozent derjenigen Menschen, die keine Antikörper gegen Sars-CoV-2 gebildet haben, fälschlicherweise Antikörper im Blut entdeckt werden. Die Herstellerangaben hätten die Bonner Wissenschaftler zudem in ihren Labors validiert, so Streeck: „Unsere eigenen Vergleichsproben zeigen bislang sogar 100 Prozent Spezifität, sie sind vom Umfang aber noch begrenzt.“« Man achte hier genau auf die Formulierung von Streeck – „vom Umfang noch begrenzt“ seien die Vergleichsproben.

Denn: »Die Untersuchungen anderer Arbeitsgruppen passen allerdings nicht ganz zu diesen Ergebnissen. So kam Charlotte Jørgensen von der Universität im dänischen Roskilde bei einem Vergleich verschiedener Testverfahren zu deutlich schlechteren Werten für den Euroimmun-Test. Sie folgert in ihrer noch nicht begutachteten Studie ebenso wie der Sars-Experte Drosten, der ähnliche Versuche unternommen hat, dass der Test nicht nur Sars-CoV-2 anzeigt, sondern auf weitere Coronaviren reagiert.«

Das hört sich kompliziert an. Zugleich aber kann man an dieser Stelle die Bedeutung der drei Gütekriterien für Testverfahren aus der allgemeinen Statistik praktisch erfahrbar machen. Sie müssen sich diese drei Kriterien merken – ein Kriterium ist eben schon in den Zitaten auftaucht, es gibt aber noch zwei andere:

➞ Sensitivität
➞ Spezifität
➞ Positiver prädikative Wert

Was muss man sich darunter vorstellen? Am Beispiel der umstrittenen Antikörpertests, mit denen man nachweisen will, ob jemand schon mal infiziert war, wird das von dem Wissenschaftsredakteur des Deutschlandfunks, Joachim Budde, in diesem Beitrag verdeutlicht: COVID-19-Erkennung: Was Schnelltests können und was sie wirklich aussagen.

Welche wichtigen Qualitätsmerkmale für einen medizinischen Test gibt es?
➔ Erstens: Die Sensitivität, also: Wie zuverlässig erkennt ein Test, dass jemand tatsächlich krank ist? Dieser Wert ist oft richtig gut und liegt zwischen 95 und 99 Prozent.
➔ Zweitens: Die Spezifizität, also: Wie oft schlägt ein Test falsch an? Es kann zum Beispiel sein, dass er auch bei Antikörpern Alarm schlägt, die der Körper gegen eines der anderen humanen Coronaviren gebildet hat. Bei manchen Tests liegt die Spezifität schon bei 98,5 Prozent. Das heißt: Bei 15 Menschen von 1.000 spuckt der Test ein positives Ergebnis aus, obwohl sie gar keine Antikörper gegen SARS-CoV-2 haben.
➔ Drittens: Der sogenannte positive prädikative Wert. Der gibt an, wie groß die Wahrscheinlichkeit ist, dass jemand auch wirklich krank ist, wenn der Test positiv ist. Und dieser Wert hängt sehr davon ab, wie verbreitet eine Krankheit überhaupt ist.

Ein Rechenbeispiel: gehen wir davon aus, dass 0,7 Prozent der Menschen in Deutschland eine Coronavirusinfektion durchgemacht haben. »Von 1.000 Menschen, die getestet werden, haben sieben tatsächlich Antikörper gegen das SARS-CoV-2. Nehmen wir an, die würde der Test alle zuverlässig finden. Wir haben ja gerade gesehen, dass der Test bei 15 von 1.000 Menschen zu Unrecht anschlägt. Bei 1.000 getesteten Menschen hätten wir damit 22 positive Testergebnisse, also 22-mal die Aussage: „Sie haben Antikörper gegen das neue Coronavirus.“ Nur sieben von den 22 Ergebnissen sind aber korrekt. Das heißt: Zwei Drittel der positiven Tests liegen falsch. Solch ein Test bringt niemandem etwas. Darum gibt es noch keine großen Studien auf Antikörper. Das wird sich erst ändern, wenn es aussagekräftigere Testverfahren gibt.

Eine Aktualisierung findet man in diesem Beitrag vom 8. Mai 2020: COVID-19: Wie gut sind Antikörpertests?: »Antikörpertests gelten als Hoffnungsträger in der Coronakrise: Sie sollen im besten Fall eine Immunität gegen das neue Virus nachweisen. Pharmafirmen und Labore entwickeln deshalb ständig neue Tests. Doch an der Verlässlichkeit hapert es noch.«
➞ Der Beitrag als Audio-Datei.

Da wird sich jetzt der eine oder andere von Ihnen, vielleicht auch alle, die (noch) vorhandenen Haare raufen. Denn das hört sich alles anders an, nur nicht nach sicheren Aussagen, die man auf dieser Basis machen kann. Aber die brauchen die Politiker natürlich, vor allem, wenn es um derart massive Maßnahmen wie einem Shutdown geht oder um die Lockerung von als Schutzmaßnahmen konzipierten Beschränkungen des individuellen und gesellschaftlichen Lebens.

Letztendlich sind wir hier angekommen bei einem unauflösbaren Dilemma für Politik und Wissenschaft, das in der folgenden Sendung thematisiert wird, die Sie sich als Audio-Datei herunterladen können:

➔ SWR: Corona – wenn Wissenschaft auf Politik trifft (17.04.2020): »In Zeiten von Corona sind Virologen und Epidemiologen in den Medien mindestens so präsent wie Politiker. Ganz so ungewöhnlich und neu ist es zwar nicht, dass Wissenschaft Politik berät, aber selten so sichtbar wie heute. Dabei treffen hier zwei ganz verschiedene Felder aufeinander. Politik will machen, Wissenschaft will wissen. Politik will schnell sein. Wissenschaft zweifelt und lässt sich im besten Falle Zeit, bevor sie Ergebnisse verkündet. Erst recht, wenn es um Menschenleben geht. Zeit, die das Corona-Virus aber nicht lässt. Wie gehen die beiden Felder mit dieser Spannung um?«

Und wem jetzt – völlig verständlich – der Kopf raucht, dem sei aus der Unmenge an Erläuterungsversuchen, die mittlerweile irgendwo erschienen sind, dieser Beitrag empfohlen:
Was die Daten zu Corona aussagen und was nicht (05.05.2020): »Mit dem neuen Coronavirus preschen täglich neue Zahlen auf uns ein – mehr Infizierte, neue Todesfälle, dazu Berechnungen über Verdopplungsraten und Sterberate. Wir erklären, was das bedeutet, was oft falsch gemacht wird und wo die Wissenschaftler noch streiten.«