Aha, ausgezeichnete Frage !!
Ich hätte auch naiv eine S-förmige logistische Kurve vorgeschlagen, aber dies ist offensichtlich eine schlechte Anpassung. Soweit mir bekannt ist, ist die ständige Zunahme ein Näherungswert, da YouTube die eindeutigen Ansichten zählt (eine pro IP-Adresse), sodass es nicht mehr Ansichten als Computer geben kann.
Wir könnten ein epidemiologisches Modell verwenden, bei dem die Anfälligkeit der Menschen unterschiedlich ist. Um es einfach zu machen, könnten wir es in die Hochrisikogruppe (sagen wir die Kinder) und die Niedrigrisikogruppe (sagen wir die Erwachsenen) einteilen. Nennen wir den Anteil "infizierter" Kinder und den Anteil "infizierter" Erwachsener zum Zeitpunkt . Ich werde die (unbekannte) Anzahl von Personen in der Hochrisikogruppe und die (ebenfalls unbekannte) Anzahl von Personen in der Niedrigrisikogruppe nennen.x(t)y(t)tXY
x˙(t)=r1(x(t)+y(t))(X−x(t))
y˙(t)=r2(x(t)+y(t))(Y−y(t)),
wo . Ich weiß nicht, wie ich dieses System lösen soll (vielleicht würde @EpiGrad es tun), aber wenn wir uns Ihre Grafiken ansehen, könnten wir ein paar vereinfachende Annahmen treffen. Da das Wachstum nicht gesättigt ist, können wir annehmen, dass sehr groß und klein ist, oderr1>r2Yy
x˙(t)=r1x(t)(X−x(t))
y˙(t)=r2x(t),
Dies sagt ein lineares Wachstum voraus, sobald die Hochrisikogruppe vollständig infiziert ist. Beachten Sie, dass es bei diesem Modell keinen Grund gibt, anzunehmen , ganz im Gegenteil, da der große Term jetzt in subsumiert wird .r1>r2Y−y(t)r2
Dieses System löst auf
x(t)=XC1eXr1t1+C1eXr1t
y(t)=r2∫x(t)dt+C2=r2r1log(1+C1eXr1t)+C2,
Dabei sind und Integrationskonstanten. Die gesamte "infizierte" Population ist dann
, die 3 Parameter und 2 Integrationskonstanten hat (Anfangsbedingungen). Ich weiß nicht, wie einfach es wäre zu passen ...C1C2x(t)+y(t)
Update: Beim mit den Parametern konnte ich die Form der oberen Kurve mit diesem Modell nicht reproduzieren, der Übergang von auf ist immer schärfer als oben. Wenn wir mit der gleichen Idee fortfahren, könnten wir wieder annehmen, dass es zwei Arten von Internetnutzern gibt: die "Teiler" und die "Einzelgänger" . Die Sharer infizieren sich gegenseitig, die Einzelgänger stoßen zufällig auf das Video. Das Modell ist0600,000,000x(t)y(t)
x˙(t)=r1x(t)(X−x(t))
y˙(t)=r2,
und löst auf
x(t)=XC1eXr1t1+C1eXr1t
y(t)=r2t+C2.
Wir könnten annehmen, dass , dh dass zum nur Patient 0 ist , was ergibt, weil ist eine große Anzahl. daher können wir annehmen, dass . Jetzt bestimmen nur die 3 Parameter , und die Dynamik.x(0)=1t=0C1=1X−1≈1XXC2=y(0)C2=0Xr1r2
Selbst bei diesem Modell scheint die Beugung sehr scharf zu sein, es ist keine gute Passform, daher muss das Modell falsch sein. Das macht das Problem eigentlich sehr interessant. Die folgende Abbildung wurde als Beispiel mit , und .X=600,000,000r1=3.667⋅10−10r2=1,000,000
Update: Aus den Kommentaren ging hervor, dass Youtube (auf geheime Weise) Aufrufe und keine eindeutigen IPs zählt, was einen großen Unterschied macht. Zurück zum Zeichenbrett.
Um es einfach zu halten, nehmen wir an, dass die Zuschauer durch das Video "infiziert" sind. Sie schauen sich das regelmäßig an, bis die Infektion beseitigt ist. Eines der einfachsten Modelle ist das SIR (Susceptible-Infected-Resistant):
S˙(t)=−αS(t)I(t)
I˙(t)=αS(t)I(t)−βI(t)
R˙(t)=βI(t)
αβx(t)x˙(t)=kI(t)k
In diesem Modell steigt die Anzahl der Aufrufe einige Zeit nach dem Ausbruch der Infektion abrupt an, was in den Originaldaten nicht der Fall ist, möglicherweise, weil sich Videos auch auf nicht virale (oder meme) Weise verbreiten. Ich bin kein Experte für die Schätzung der Parameter des SIR-Modells. Ich spiele nur mit verschiedenen Werten. Hier ist, was ich mir ausgedacht habe (in R).
S0 = 1e7; a = 5e-8; b = 0.01 ; k = 1.2
views = 0; S = S0; I = 1;
# Exrapolate 1 year after the onset.
for (i in 1:365) {
dS = -a*I*S;
dI = a*I*S - b*I;
S = S+dS;
I = I+dI;
views[i+1] = views[i] + k*I
}
par(mfrow=c(2,1))
plot(views[1:95], type='l', lwd=2, ylim=c(0,6e8))
plot(views, type='n', lwd=2)
lines(views[1:95], type='l', lwd=2)
lines(96:365, views[96:365], type='l', lty=2)
Das Modell ist offensichtlich nicht perfekt und könnte auf viele solide Arten ergänzt werden. Diese sehr grobe Skizze sagt ungefähr im März 2013 eine Milliarde Aufrufe voraus, mal sehen ...