Corona-Tester in einem Abstrich-Zentrum.
Bildrechte: BR
Bildbeitrag

Corona-Tester - In den letzten Wochen fragten sich viele BR24-Leser: Warum ist der R-Wert so niedrig, obwohl die Fallzahlen so hoch sind?

Bildbeitrag
>

#Faktenfuchs: R-Wert - Die Tücken einer wichtigen Corona-Zahl

#Faktenfuchs: R-Wert - Die Tücken einer wichtigen Corona-Zahl

Wenn die Reproduktionszahl kleiner als eins ist, geht die Zahl der Neuinfektionen zurück. Eine Corona-Weisheit, die in den vergangenen Wochen oft nicht stimmte. Berechnung, Aussagekraft, Kritik – der #Faktenfuchs nimmt den R-Wert unter die Lupe.

Von
Claudia Kohler
Steffen Kühne

In den vergangenen Wochen fragten sich (wie zahlreiche Menschen in Deutschland auch) viele BR24-Leser, warum die täglich vom Robert Koch-Institut (RKI) berichtete Zahl der Corona-Neuinfektionen auf neue Höchstwerte anstieg, die Reproduktionszahl R jedoch immer wieder unter eins lag. In BR24-Facebook-Kommentaren stellten User diese Frage mehrfach. Der #Faktenfuchs legt dar, wie es zu diesem scheinbaren Widerspruch kommen kann.

Bildrechte: BR
Bildbeitrag

In den letzten Wochen fragten sich viele BR24-Leser: Warum ist der R-Wert so niedrig, obwohl die Fallzahlen so hoch sind?

Zunächst aber einige grundlegende Fragen und Antworten zur Reproduktionszahl R :

Was sagt die Reproduktionszahl R eigentlich aus?

Die Reproduktionszahl wird seit Beginn der Corona-Pandemie verwendet, um das aktuelle Infektionsgeschehen zu beurteilen. Sie gibt an, wie viele weitere Personen eine infizierte Person im Durchschnitt ansteckt. Forscher gehen im Falle des Coronavirus von einer Basisreproduktionszahl (R0) zwischen 2,4 und 3,3 aus.

Das heißt, ohne Eindämmungsmaßnahmen würde jeder Infizierte im Durchschnitt zwei bis drei Menschen anstecken und das Virus würde sich sehr schnell verbreiten. Entscheidend ist aber die effektive Reproduktionszahl, also wie viele Menschen sich trotz Gegenmaßnahmen anstecken. Diese Zahl ist in der Praxis deutlich schwerer zu erfassen. Trotzdem ist sie eine wichtige Kennzahl, von der auch politische Entscheidungen abhängen können.

Im Rahmen einer Pandemie ist das Ziel, die Reproduktionszahl langfristig unter eins zu halten. Dann sinken die Fallzahlen und das Infektionsgeschehen wird kontrollierbarer.

Wie wird der R-Wert berechnet?

Die Berechnung der R-Werte, so wie sie das RKI, einige andere Forscher und viele Medien täglich durchführen, ist überschaubar. Die Datenjournalisten des BR gehen bei ihrer Berechnung aus den vom RKI gemeldeten Zahlen der Neuinfektionen wie folgt vor:

Bildrechte: BR
Bildbeitrag

In den letzten Wochen fragten sich viele BR24-Nutzer: Warum ist der R-Wert niedrig, obwohl die Fallzahlen immer weiter steigen?

  • Zuerst wird aus den Zahlen ein sogenannter gleitender Mittelwert berechnet: Dabei wird für jeden Tag der Durchschnittswert der Neuinfektion der vergangenen sieben Tage berechnet.
  • Nun wird die Summe der Neuinfektionen eines viertägigen Zeitabschnitts durch die Summe der Neuinfektionen aus den vier Tagen davor geteilt.
  • Im Gegensatz zum RKI wird bei BR Data kein Nowcasting verwendet – ein statistisches Verfahren, um die aktuellsten Zahlen der Neuinfektionen vorherzusagen. Um die Meldeverzögerung dennoch ein Stück weit auszugleichen, wird der gesamte Berechnungszeitraum zwei Tage nach hinten verschoben.
  • Zudem wird ein sogenanntes Konfidenzintervall mit einem Höchstwert und einem Tiefstwert berechnet, welches den R-Wert mit 95-prozentiger Wahrscheinlichkeit abdeckt.

Das größte Problem bei der Berechnung der Reproduktionszahl sind Verzögerungen in der Meldekette. An den Wochenenden werden weniger Fälle gemeldet als werktags. In Grafiken und Diagrammen sind diese wöchentlich auftretenden Lücken deutlich zu sehen.

Warum ermittelt das RKI zwei verschiedene R-Werte?

In den Lageberichten des Robert Koch-Instituts finden sich seit Mai zwei verschiedene Reproduktionszahlen. Das 4-Tage-R wird, wie eben beschrieben, durch das Teilen der Fallzahlsummen zweier viertägiger Zeitabschnitte ermittelt. Vier Tage ist die vom RKI für das Coronavirus geschätzte Generationszeit, also die mittlere Zeitspanne von der Infektion einer Person bis zur Infektion der von ihr angesteckten Folgefälle. Für das 7-Tage-R wird zur Ermittlung ein 7-Tages-Intervall benutzt, um die Schwankungen der Daten im Wochenverlauf auszugleichen.

Imputation und Nowcasting

Das RKI verwendet außerdem statistische Verfahren, um das Problem der Verzögerung in den Meldedaten auszugleichen. So benutzen die Fachleute dort beispielsweise die Fallzahlen nach Erkrankungsdatum als Grundlage der Berechnungen. Das Erkrankungsdatum wird aber nur bei einem Bruchteil der Neuinfektionen angegeben. Über eine Wahrscheinlichkeitsrechnung kann daraus jedoch die Verteilung der restlichen Fälle nach Erkrankung geschätzt werden. Dieses Verfahren nennt man Imputation.

Mit dem Begriff Nowcasting ist gemeint, dass sich anhand der bisher gemeldeten Fälle auch abschätzen lässt, um wieviel die aktuellsten Werte zu niedrig liegen. Das RKI verwendet nach eigenen Angaben eine Nowcasting-Methode, die die Schätzung zwar für die zuletzt beobachteten Verzögerungen adjustiere, aber einen etwa bestehenden Trend nicht weiter fortsetzte. Es werde dementsprechend angenommen, dass der Verzug in den folgenden Tagen konstant so bleibe, wie zuletzt beobachtet.

Verwirrung: Niedriger R-Wert trotz steigender Neuinfektionszahlen

Wie schwierig der Umgang mit den statistischen Größen in der Realität ist, zeigte die Verwirrung der letzten Wochen. In den Situationsberichten des RKI wurde täglich eine höhere Zahl an Neuinfektionen gemeldet als am Vortag. Die Reproduktionszahlen lagen jedoch häufig unter eins.

Als einer der ersten wies TAZ- Journalist Malte Kreutzfeldt darauf hin, dass das RKI die R-Werte nicht nur täglich im Situationsbericht, sondern auch zusammengefasst in einer Tabelle veröffentlicht. Dort sind sie nach Datum aufgelistet.

Für diese Liste werden alle R-Werte täglich mit den aktuellsten Daten neu berechnet. In einem Twitter-Thread vergleicht Kreutzfeld die Werte und stellt fest, dass die Reproduktionszahlen aus den Lageberichten das Infektionsgeschehen oft unterschätzt hatten:

Ist die starke Unterschätzung der vergangenen Wochen also normal?

Auf Anfrage des Bayerischen Rundfunks erklärt das RKI, dass die aktuellsten R-Werte, die auf der Prognose des Nowcastings beruhen, im zeitlichen Verlauf immer angepasst werden, weil fortlaufend neue Fallmeldungen eingehen und die Prognose korrigieren.

Laut dem Robert Koch-Institut gibt es also immer eine gewisse Korrektur. In den letzten Wochen hätten vor allem die am Anfang der Woche berichteten R-Werte nach oben korrigiert werden müssen. Das wiederum sei aber nicht immer so - in der Vergangenheit seien die Werte teilweise auch nach unten korrigiert worden. Generell unterlägen die R-Werte einer gewissen wöchentlichen Schwankung.

Unsicherheiten in den statistischen Verfahren

Aber auch Unsicherheiten im Nowcasting-Verfahren hätten dazu beigetragen, dass in den vergangenen Wochen oft zu wenig neue Fälle geschätzt wurden, woraus die zu niedrigen R-Werte resultierten. Laut RKI gäbe es einen gewissen Effekt in Richtung einer etwas längeren Dauer zwischen Erkrankungsbeginn und Übermittlung der Fallmeldung an das RKI. Gesundheitsminister Jens Spahn sprach bereits von einem „überlasteten Gesundheitswesen“. Das führe tendenziell zu einer leichten Unterschätzung der Anzahl von neuen Fällen im Nowcasting

Ein weiterer Effekt, der die Qualität des Nowcastings laut RKI limitiert: Nicht alle Erkrankungsbeginne würden direkt bei der ersten Übermittlung des Falles an das Institut vorliegen, sondern zum Teil nachgetragen werden. Durch die nachträgliche Korrektur der Werte würden diese zusätzlichen Informationen dann berücksichtigt, so dass die R-Werte nach ein paar Tagen valider seien.

Die folgende Grafik veranschaulicht die Korrekturen seit dem ersten Oktober. Die dunklere Kurve zeigt jeweils den R-Wert, wie er im jeweiligen Situationsbericht veröffentlicht wurde. Die hellere Kurve zeigt den R-Wert, wie er für das entsprechende Datum mit den neuesten Daten (Stand: 13. November) berechnet wurde:

Bildrechte: BR
Bildbeitrag

Der Unterschied zwischen den am Tag gemeldeten R-Werten und den für diesen Tag mit den neuesten Daten berechneten R-Werten.

Vor allem das 7-Tage-R zeigt in der korrigierten Version eine deutlich stabilere Entwicklung und fällt viel später unter die Grenze eins.

Der generelle Abwärtstrend des R-Werts sei korrekt, so das RKI. Denn obwohl die Fallzahlen noch immer stiegen und Höchstwerte erreichten, habe sich der prozentuale Anstieg verlangsamt, von 48,5% mehr neuen Fällen in Kalenderwoche 44 auf 12,7 Prozent mehr neue Fälle in KW 45.

Verschiedene Modelle, verschiedene Ergebnisse

Das Vorgehen des RKI ist nur eine Möglichkeit, um die Reproduktionszahl R zu ermitteln. Wie sehr sich die geschätzten R-Werte anhand der zugrundeliegenden statistischen Methoden unterscheiden können, zeigt folgende Grafik:

Bildrechte: BR
Bildbeitrag

Die R-Werte unterscheiden sich je nach Methode stark voneinander.

Küchenhoff (LMU) kritisiert 4-Tage-R des RKI

Professor Helmut Küchenhoff von der LMU München sieht besonders den 4-Tage-Wert des RKI kritisch. Gemeinsam mit der Universität Stockholm hat sein Team ebenfalls ein Modell entwickelt, um die Verteilung der Fälle nach Erkrankungsbeginn zu ermitteln, inklusive Nowcast-Prognose bis zu zwei Tage vor dem aktuellen Datum. Für die Schätzung des R-Wertes verwendet es ein in der Forschungsliteratur etabliertes Vorgehen.

Ein wichtiger Unterschied zum RKI: Küchenhoffs Team rechnet mit einer Zeitspanne von zehn Tagen, in der die meisten Reproduktionen, sprich Ansteckungen, stattfinden. Entsprechend sagt der Experte: "Der 4-Tage-Wert des RKI ist trotz der statistischen Modellierung sehr abhängig vom Wochengang der Infektionszahlen. Entsprechend sprunghaft ist sein Verlauf."

Auch in anderen Parametern unterscheiden sich die Verfahren.

LMU München erzielt stabile R-Werte für Bayern

Die Verlaufskurve des LMU-R-Wertes ist nur bedingt mit der des RKI vergleichbar, denn sie wird nur für Bayern und die Stadt München anhand der Daten des Bayerischen Landesamts für Gesundheit und Lebensmittelsicherheit (LGL) geschätzt. Eine kritische Reflexion zu Beginn der Pandemie habe laut Küchenhoff aber gezeigt, dass die Werte aus dem Nowcast-Verfahren der LMU kaum rückwirkend korrigiert werden mussten. Entsprechend konstant dürfte sich, so der Statistiker, auch die Reproduktionszahl verhalten.

Trotz dieses Erfolges mahnt Küchenhoff zur Vorsicht im Umgang mit den Zahlen: "Die Reproduktionszahl ist nur ein abgeleiteter Wert und muss mindestens zusammen mit der Kurve der Neuinfektionen betrachtet werden."

Es sei auch wenig sinnvoll, sich nur an einen festen Wert, etwa R kleiner als eins, zu klammern. Entscheidend sei die Entwicklung: Sinken beide Indikatoren über einen längeren Zeitraum hinweg, kann von einem Abflauen des Infektionsgeschehens gesprochen werden.

Forschungszentrum Jülich spricht sich für komplexere Simulation aus

Am Institut von Professor Wolfgang Wiechert am Forschungszentrum Jülich haben Michael Osthege und Laura Helleckes, aufbauend auf amerikanischen Vorarbeiten, ebenfalls ein Modell entwickelt, mit dem sich die Neuinfektionen nach Infektionsdatum, inklusive Prognose für die letzten Tage, und der R-Wert abschätzen lassen. Sie werten inzwischen täglich die Daten aus ganz Europa aus. Anders als beim RKI und vielen anderen Berechnungsmethoden lässt sich das Jülicher Verfahren jedoch nicht durch eine Sequenz einfacher statistischer Formeln berechnen.

Es handele sich, so die Forscher, vielmehr um eine komplexe Simulation, die viele Parameter berücksichtige, etwa die stochastische Verteilung des Testverzugs und die Anzahl der durchgeführten Tests. Das Modell simuliere eine Vielzahl möglicher Verläufe und vergleiche die Ergebnisse mit den vorliegenden Daten. So werde eine Reproduktionszahl geschätzt, die von Schwankungen in den Daten nicht so stark abgelenkt werde. Die R-Kurve sei insbesondere unempfindlich gegenüber Schwankungen im Wochenverlauf (Wochenend-Tief).

Entscheidungsfindung sollte verschiedene Modelle berücksichtigen

Dennoch sagt Professor Wolfgang Wiechert: "Dadurch, dass wir länger rechnen, ist unser Modell nicht zwangsweise besser, als das des RKI – aber es ist etwas weniger abhängig von den Daten der letzten Tage."

Andererseits basiert das Modell auf einigen spezifischen Grundannahmen, die zu systematischen Verzerrungen der R-Wert Schätzungen führen könnten. Grundsätzlich gelte: Kein einfaches Modell kann die komplexe Realität genau abbilden.

Für die Jülicher Forscher ergibt es daher keinen Sinn, bei der Berechnung des R-Wertes von "besser" oder "schlechter" zu sprechen. Bei der Entscheidungsfindung sollten verschiedenste Modelle übereinandergelegt werden, um zu einem Mittel zwischen "best case"- und "worst case"-Szenario zu kommen. Dies werde in anderen Ländern, etwa im Bundesstaat Kalifornien in den USA, bereits praktiziert.

Wiechert (Jülich) fordert Verbesserung der Datenlage

Der nachdrücklichste Punkt für Teamleiter Wolfgang Wiechert ist aber nicht, die statistischen Modelle und Verfahren, sondern die Datenlage zu verbessern. Deutschland läge hier im internationalen Vergleich noch weit zurück. Das Gesundheits- und Meldewesen müsse grundlegend saniert und digitalisiert werden, damit Stellen wie das RKI möglichst schnell mit möglichst akkuraten Daten arbeiten könnten.

Trotz der Schwierigkeiten hält der Datenwissenschaftler die Reproduktionszahl für einen der wichtigsten Pandemie-Indikatoren: "Mit den Neuinfektionen und dem R-Wert kann man das Geschehen in der zweiwöchigen Vergangenheit abbilden und anhand guter Modelle auch die aktuelle Lage abschätzen. Das ist immer noch viel besser, als aus dem Bauch heraus zu entscheiden."

RKI reagiert mit neuer Darstellung

Das RKI hat bereits auf die Verwirrung um die R-Werte reagiert und zeigt in seinem täglichen Situationsbericht seit dem 11. November nicht nur wie bisher die beiden aktuellen R-Werte, sondern auch deren zeitlichen Verlauf. Die Berechnung der vergangenen R-Werte erfolgt dabei nach den neuesten Daten. So lässt sich die Entwicklung besser nachvollziehen. Zudem wolle man versuchen, "das Verfahren zu verbessern, so dass die Wochentags-Abhängigkeit noch besser kontrolliert werden kann."

Fazit:

Die Reproduktionszahl R wird von Experten als wichtiger Indikator für die Entwicklung der Corona-Pandemie eingeschätzt. Liegt R eine längere Zeit unter dem Wert eins, ist das Infektionsgeschehen rückläufig. Dass die R-Werte in den vergangenen Wochen trotz stark steigender Fallzahlen immer wieder unter der Kennmarke lagen, liegt vor allem an den Unsicherheiten in den statistischen Verfahren des Robert Koch-Instituts. Jedoch kann kein Modell die komplexe Realität genau abbilden.

Andere Fachstellen, wie die LMU München und das Forschungszentrum Jülich, sprechen sich dafür aus, für die Entscheidungsfindung mehr als nur ein Modell zur Ermittlung der Reproduktionszahl heranzuziehen. Außerdem wichtig: Der effektive R-Wert ist nur eine statistische Abschätzung. Er sollte daher immer mit den statistischen Begleitwerten, etwa dem Konfidenzintervall mit Höchst- und Tiefstwerten, beurteilt und immer mit anderen Indikatoren, etwa der Zahl der Neuinfektionen, zusammen betrachtet werden.

"Darüber spricht Bayern": Der BR24-Newsletter informiert Sie immer montags bis freitags zum Feierabend über das Wichtigste vom Tag auf einen Blick - kompakt und direkt in Ihrem privaten Postfach. Hier geht's zur Anmeldung!