Nachhilfe in elementarem Rechnen und wissenschaftlicher Methodik

Im mathematischen Institut habe ich als Mathe-Hiwi gearbeitet. Meine Aufgabe war es, in den Übungen, die Einführungsvorlesungen begleiten, Übungsaufgaben von Studenten zu korrigieren. Das bedeutet, Beweisgänge Schritt für Schritt zu überprüfen, um genau die Stelle zu markieren, an dem ein Fehlschluß auftrat, und das genau zu begründen. Nur so tritt ein Lerneffekt auf, weil man lernt, Fehler zu vermeiden. Es war nicht statthaft, ein Ergebnis nur als falsch anzustreichen; es mußte punktgenau erklärt werden, welche Zeile oder welcher Gedanke aus welchem Grund fehlerhaft war.

Beginnen wir mit einem ‚dicken Hund’.

«Das RKI erklärt sein folgendes Vorgehen bei der Berechnung von R in einem „Epidemiologischen Bulletin” wie folgt:

„Bei einer konstanten Generationszeit von vier Tagen ergibt sich R als Quotient der Anzahl von Neuerkrankungen in zwei aufeinander folgenden Zeitabschnitten von jeweils vier Tagen. Der so ermittelte R-Wert wird dem letzten dieser acht Tage zugeordnet, weil erst dann die gesamte Information vorhanden ist.

Daher beschreibt dieser R-Wert keinen einzelnen Tag, sondern ein Intervall von vier Tagen.»1 (Morgenpost)

Die Reproduktionszahl wird laut der Definition des Robert-Koch-Instituts berechnet, indem ein Quotient gebildet wird aus zwei Summen, denen der Meldung von Neuerkrankungen in den letzten vier Tagen, und denen aus den vorigen vier Tagen.

Was geschieht nun, wenn, wie am 6. Mai 2020 geschehen, die Testkriterien geändert werden?

«Am 6. Mai wurden vom RKI ja die Richtlinien geändert, wer getestet werden soll (1). Von da an werden alle Personen mit respiratorischen Symptomen jeder Schwere getestet, unabhängig davon, ob es irgendwelche zusätzlichen Risikofaktoren gibt. Letzteres ist die Änderung, vorher mußte eine Person zusätzlich zu Symptomen Risikofaktoren aufweisen. Zudem wird inzwischen zunehmend in der Breite völlig unabhängig von Symptomen getestet, wie die Medienberichte zu Testungen im Bereich des Fußballs (2) und im Bereich der Schlachthöfe zeigen – hier läßt beispielsweise Schleswig-Holstein die Belegschaften aller großen Betriebe im Land testen (3).»2 (Compact)

Es wurde offenbar zuvor verlangt, erstens Symptome zu haben, und zweitens, daß Risikofaktoren vorlagen. Nach der Änderung wurde schon dann getestet, wenn Symptome vorlagen, auch wenn der Patient keiner Risikogruppe (mit Risikofaktoren) zugerechnet wurde. Das ist ein ‚dicker Hund’. Wenn man mit konsistenten Daten arbeiten will, dürfen die Meßdaten nicht von während der Testreihe sich ändernden Meßweisen abhängen. Das geht grundsätzlich nicht. Wer das nicht begreift, ist zu dumm für wissenschaftliches Arbeiten, hat weder an einer Hochschule, noch an einem wissenschaftlichen Institut wie dem RKI etwas verloren. Hier liegt ein grundsätzliches Dummenproblem vor, da es offenbar mehr darauf ankam, möglichst viele Hochschulabsolventen zu erzielen, besonders aus sich hysterisch für angeblich ‚benachteiligt’ ansehenden Gruppen, statt das Niveau auf der gebotenen Höhe zu halten.

Also: Bereits der Ansatz ist Pfusch. Was geschieht logischerweise, nachdem am 6. Mai ein Testkriterium aufgehoben wurde, nämlich einer Risikogruppe anzugehören? Folgendes: Es werden mehr Personen getestet als zuvor. Wir vernachlässigen an dieser Stelle die Frage, wie viele Patienten wir betrachten, denn das fluktuiert und können wir nicht im voraus wissen. Wir wissen aber wohl, daß ein höherer Anteil getestet werden wird, nämlich jene dazutreten, die Symptome haben, aber keiner Risikogruppe zugeordnet werden.

Die Folge davon ist, daß am Tag nach dem Wirksamwerden der Regeländerung in der Variablen X1 ein unvergleichlicher Wert steht, weil dieser einen zusätzlichen Personenkreis enthält, der in den Variablen X2 bis X8 noch fehlt. Dadurch ergibt sich im Quotienten ein Sprung nach oben. Das geht so weiter bis zum Tage 4, in dem im Zähleralle Variablen X1 bis X4 vergrößert sind durch den hinzugekommenen Patientenkreis. Am Tage 4 ist der Sprung des Quotienten R nach oben also am größten.

Was taten wissenschaftliche Banausen im Robert-Koch-Institut, denen man ihren akademischen Grad wegen Unfähigkeit entziehen müßte? Sie gaben eine Warnung wegen ‚gestiegener Reproduktionszahl’ aus.

Verfolgen wir weiter, was logischerweise geschieht; es sei denn, die Erkrankungsrate verändert sich so stark, daß tatsächliche Änderungen die durch arithmetische Fehler bewirkte Änderung überwiegen. Am Tage 5 tritt erstmals auch unten im Nenner die Vergrößerung der Datenbasis bei der Variablen X5 in Erscheinung, weshalb der Quotient R nach unten zu springen beginnt. Dies setzt sich fort bis zum Tage 8 (14.5.2020, falls die Änderungen sofort wirksam wurden), an dem auch im Nenner alle Variablen X5 bis X8 Werte nach den neuen Kriterien enthalten. Nunmehr sind die Daten insgesamt wieder konsistent, weshalb die beiden Sprünge, erst nach oben, dann nach unten, beendet sind.

Wie reagiert das Robert-Koch-Institut? Sie stellen plötzlich fest, daß sie erstens Kritik erhalten, und zweitens nach ihrer Alarmmeldung R wieder zu sinken beginnt. Entweder sind sie aber unfähig, zu erkennen, weshalb das geschieht, weil sie ihre einfache simple Rechnung nicht begreifen, oder sie sind unehrlich und versuchen, ihren Fehler zu vertuschen. Was auch immer, in beiden Fällen haben sie sich disqualifiziert. So etwas gehört nicht in ein wissenschaftliches Institut, so wenig wie ideologische Aktivisten, seien es ‚Forscher’ auf unwissenschaftlichen Gebieten wie Gender, Feminismus, Ideologiefächer anderer Art, oder Klima‚wissenschaftler’, die eben mal hundert Jahre rückwärts Meßwerte nach unten kalibrieren, worauf sie mit viel Datenmauschelei plötzlich einen Hockeystab hervorzaubern, den sie vor Gericht nicht begründen können.

Das Robert-Koch-Institut reagierte, indem es verkündete, ‚Sprünge von R’ vermeiden zu wollen, indem sie geglättete Werte für die Berechnung benutzen. Das löst ihr Problem nicht, weil sie ihren Kardinalfehler überhaupt nicht bemerken, sondern durch Glättung vertuschen.

«Corona-News im Live-Blog: RKI will Reproduktionszahl neu berechnen
T. Pillgruber, M. Schnippert 12. Mai 2020 …
12:03 Uhr: RKI kündigt neue Berechnung für Reproduktionszahl an …

Das Robert-Koch-Institut will die sogenannte Reproduktionszahl neu berechnen. Hintergrund ist, daß der R-Wert generell Schwankungen unterliege. … Deshalb will das RKI in Zukunft einen sogenannten geglätteten R-Wert mitteilen»3 (gmx.net)

Wie wäre ein vernünftiges Vorgehen, wie es in Zeiten, als noch wissenschaftlich gearbeitet wurde, weil es das notwendige Niveau gab, auch getan wurde? Nun, bei uns wäre vorgeschlagen worden, folgende Daten zu erheben:

1.) Datum des Tests
2.) Zugehörigkeit zu Risikogruppe: ja / nein (oder Risikofaktor xyz ja / nein)
3.) Ergebnis des Tests

Falls das RKI beabsichtigt, noch mit weiteren Testkriterien zu spielen, sie bei Bedarf im Laufe einer Erkankungswelle verändern, dann würden auch diese hier aufgeführt und müßten bei der Meldung angegeben werden.

Wenn künftig die Testkriterien verändert werden, wäre es ein leichtes, dies vollautomatisch bei der Berechnung zu berücksichtigen. Es würden also bei der Berechnung beispielsweise in der Übergangszeit für alle Variablen nur Meldungen gezählt, die dem alten Stand (Patient gehört Risikogruppe an) entsprechen. Somit gäbe es zu keinem Zeitpunkt inkonsistente Daten. Oder man berücksichtigt die zusätzlich getesteten gar nicht. So werden niemals Äpfel durch Birnen geteilt. Aber offenbar sind Mitarbeiter des Robert-Koch-Instituts nicht in der Lage, solche logischen Probleme selbst zu erkennen und im voraus dementsprechend zu planen.

«Das RKI erklärt sein folgendes Vorgehen bei der Berechnung von R in einem „Epidemiologischen Bulletin” wie folgt: …
Das dazu gehörende Infektionsgeschehen liegt jeweils eine Inkubationszeit vor dem Erkrankungsbeginn.
Hat sich die Anzahl der Neuerkrankungen im zweiten Zeitabschnitt erhöht, so liegt das R über 1. Ist die Anzahl der Neuerkrankungen in beiden Zeitabschnitten gleich groß, so liegt die Reproduktionszahl bei 1. Dies entspricht dann einem linearen Anstieg der Fallzahlen.”»4 (Morgenpost)

Es gibt aber noch weitere ‚dicke Hunde’. Man bestimmt offenbar das Infektionsgeschehen nicht aus Infektionen, sondern aus Erkrankungen, wobei sich der Zeitpunkt der Infektion aus einer hypothetischen Inkubationszeit ergibt, die überdies in Wirklichkeit je nach Patient sehr verschieden sein kann. Die Reproduktionszahl soll aber nicht die Zunahme oder Abnahme von Erkrankungen ausdrücken, sondern etwas über Infizierte aussagen: Wie viele andere steckt ein Infizierter, ob erkrankt oder symptomfrei, an? Es wird also obendrein ein falscher Datensatz benutzt. Man mauschelt mit Annahmen aus einem Datensatz über Erkrankte einen anderen über Infizierte. Wenn sich die Wirklichkeit nicht so verhält wie angenommen, arbeitet man mit Schrottdaten, und zwar zu jedem Zeitpunkt. Auch das ist bereits vom Ansatz her inakzeptabel. Wenn etwas über Infektionen ausgesagt werden soll, dann müssen Infektionen gemeldet werden. Es müßte Ärzte, Krankhäuser und Labore, die Tests vornehmen, anweisen, Infektionen zu melden. Denkbar wäre auch, alle Testergebnisse melden zu lassen, einschließlich jener mit negativem Befund, wenn die Testpersonen nicht infiziert sind. Das wäre eine gute Möglichkeit, die Infektionsrate der Bevölkerung direkt zu messen, statt mit vielen Annahmen etwas aus Daten herausrechnen zu wollen, was nicht direkt gemessen wurde, und daher auch nicht verläßlich den Daten entnommen werden kann.

Es kommt aber, wie Science Files erläuterte, noch schlimmer.

«Die Anzahl der Neuinfektionen, die dem RKI gemeldet werden und die z.B. heute verkündet wird, ist ein Potpourri der unterschiedlichsten Erkrankungszeitpunkte (je nach Meldebehörde liegen die Erkrankungszeitpunkte um bis zu 12 Tage in der Vergangenheit). Nicht alle heute gemeldeten Neuerkrankten sind ZUM SELBEN ZEITPUNKT erkrankt. Um dieses Problem, das sich auch daraus ergibt, daß zu viele Köche im Meldebrei rühren, zu beherrschen, erfolgt ein Nowcasting, mit dem der aktuelle Stand der Infektionen hochgerechnet wird, und zwar auf Grundlage der Zuordnung der neu gemeldeten Fälle zu ihren jeweiligen Erkrankungszeitpunkten.»5 (Science Files)

Verschiedene Institutionen melden zu verschiedenen Zeitpunkten Daten, die dann zurückgerechnet werden auf den mutmaßlichen Zeitpunkt der Erkrankung (≠ Infektion), um daraus eine Aussage über Infektionen zu basteln. Man wundert sich nicht mehr, wenn Daten unzuverlässig werden. Es erinnert an Temperaturreihen aktivistischer Klimaforscher, mit denen vermeintliche Notstände begründet werden. Jetzt noch zusätzlich eine Glättung vorzunehmen vergrößert die Bearbeitung der Daten weiter, entfernt sie von der ursprünglich gemessenen Realität. Physiker mögen so etwas tun, wenn sie etwa weit im All entfernte Himmelskörper und Erscheinungen untersuchen; diese wissen aber hoffentlich, was sie tun. Beim RKI entsteht dagegen der Eindruck, wie bei aktivistischen Klimaforschern, daß Datennachbearbeitung in den echten Rohdaten vorhandene Tendenzen verdeckt oder gar verfälscht. Denn zwei acht Tage lang selbst geschaffene Sprünge ihrer Größe R werden nicht etwa behoben, sondern durch mathematische Kniffe wieder weggeglättet, was die Inkonsistenz ihrer Daten nicht behebt, sondern versteckt. Das ist aber ein Mißbrauch der Mathematik. Man brüstet sich sozusagen mit einem mathematischen Apparat als ‚wissenschaftlich’, obwohl es Humbug ist, was man macht, indem man Fehler kaschiert statt zu beheben.

Fußnoten

1 https://www.morgenpost.de/vermischtes/article228924543/Corona-Reproduktionszahl-Was-ist-das-Wie-wird-sie-berechnet.html

2 https://www.compact-online.de/was-uns-der-staat-verschweigt-corona-ansteckung-nicht-gestiegen/

3 https://www.gmx.net/magazine/news/coronavirus/corona-aktuell-live-ticker-merkel-macron-planen-lockerung-grenze-34468484

4 https://www.morgenpost.de/vermischtes/article228924543/Corona-Reproduktionszahl-Was-ist-das-Wie-wird-sie-berechnet.html

5 https://sciencefiles.org/2020/04/28/reproduktionszahl-r-wie-wird-sie-berechnet-anders-als-die-meisten-denken/