Die bisherigen Antworten konzentrierten sich auf die Daten selbst, was bei der Site, auf der sich diese befindet, und den Fehlern darin Sinn macht.
Aber ich bin ein rechnergestützter / mathematischer Epidemiologe, deshalb werde ich auch ein wenig über das Modell selbst sprechen, weil es auch für die Diskussion relevant ist.
Meines Erachtens sind die Google-Daten nicht das größte Problem mit dem Papier . Mathematische Modelle in der Epidemiologie verarbeiten ständig unordentliche Daten, und meines Erachtens könnten die damit verbundenen Probleme mit einer recht einfachen Sensitivitätsanalyse behoben werden.
Das größte Problem ist für mich, dass sich die Forscher "zum Erfolg verurteilt" haben - etwas, das in der Forschung immer vermieden werden sollte. Sie tun dies in dem Modell, das sie an die Daten anpassen möchten: einem Standard-SIR-Modell.
Kurz gesagt, ein SIR-Modell (das für anfällig (S) infektiös (I) wiederhergestellt (R) steht) ist eine Reihe von Differentialgleichungen, die den Gesundheitszustand einer Bevölkerung bei Auftreten einer Infektionskrankheit verfolgen. Infizierte Personen interagieren mit anfälligen Personen, infizieren sie und wechseln dann mit der Zeit in die Kategorie „Genesung“.
Dies erzeugt eine Kurve, die so aussieht:
Schön, nicht wahr? Und ja, dieser ist für eine Zombie-Epidemie. Lange Geschichte.
In diesem Fall ist die rote Linie das, was als "Facebook-Benutzer" modelliert wird. Das Problem ist folgendes:
Im grundlegenden SIR-Modell nähert sich die I-Klasse schließlich und unweigerlich asymptotisch Null .
Es muss passieren. Es spielt keine Rolle, ob Sie Zombies, Masern, Facebook oder Stack Exchange usw. modellieren. Wenn Sie es mit einem SIR-Modell modellieren, ist die unvermeidliche Schlussfolgerung, dass die Population in der ansteckenden Klasse (I) auf ungefähr Null sinkt.
Es gibt äußerst einfache Erweiterungen des SIR-Modells, die dies nicht zutreffen lassen - entweder können Sie dafür sorgen, dass Personen in der Klasse "Wiederhergestellt (R)" wieder anfällig (S) werden (im Grunde genommen sind dies Personen, die Facebook verlassen haben und sich von "Ich bin" unterscheiden) Gehen Sie niemals "zu" Ich gehe vielleicht eines Tages zurück "), oder Sie können neue Leute in die Bevölkerung aufnehmen (das wären die kleinen Timmy und Claire, die ihre ersten Computer bekommen).
Leider passten die Autoren nicht zu diesen Modellen. Dies ist übrigens ein weit verbreitetes Problem bei der mathematischen Modellierung. Ein statistisches Modell ist ein Versuch, die Muster von Variablen und ihre Wechselwirkungen innerhalb der Daten zu beschreiben. Ein mathematisches Modell ist eine Behauptung über die Realität . Sie können ein SIR-Modell erhalten, das zu vielen Dingen passt, aber Ihre Wahl eines SIR-Modells ist auch eine Aussage über das System. Das heißt, wenn es einmal seinen Höhepunkt erreicht hat, geht es auf Null.
Übrigens verwenden Internetfirmen Modelle zur Benutzerbindung, die epidemischen Modellen sehr ähnlich sehen, aber auch erheblich komplexer sind als die in der Veröffentlichung vorgestellten.