Hier geht es darum, zu einer Gleichung zu gelangen, die die beobachteten Daten auf Signal und Rauschen analysiert. Wenn Ihre Daten einfach sind, funktioniert Ihr Regressionsansatz möglicherweise. Es sollte darauf geachtet werden, einige der Annahmen zu verstehen, die sie mit dem Propheten treffen. Sie sollten besser verstehen, was der Prophet tut, da es nicht nur zu einem einfachen Modell passt, sondern versucht, eine Struktur hinzuzufügen.
Zum Beispiel könnten einige Überlegungen, die ich nach dem Lesen ihrer gut geschriebenen Einführung gemacht habe, Ihnen bei Ihrer Bewertung helfen. Ich entschuldige mich im Voraus, wenn ich ihren Ansatz missverstanden habe, und möchte in diesem Fall korrigiert werden.
1) Ihr führendes Beispiel weist zwei Trendpunkte auf, aber sie haben nur den offensichtlichsten erfasst.
2) Sie ignorieren alle ARIMA-Strukturen, die ausgelassene stochastische Reihen oder den Wert der Verwendung historischer Werte von Y als Richtschnur für die Prognose widerspiegeln.
3) Sie ignorieren mögliche Dynamiken (Lead- und Lag-Effekte) von vom Benutzer vorgeschlagenen stochastischen und deterministischen Reihen. Die kausalen Regressionseffekte des Propheten sind einfach nur zeitgleich.
4) Es wird kein Versuch unternommen, Stufen- / Pegelverschiebungen in der Reihe oder saisonale Impulse zu identifizieren, z. B. eine Änderung des MONTAGSEFFEKTES in der Mitte der Zeit aufgrund eines unbekannten externen Ereignisses. Prophet geht von einem "einfachen linearen Wachstum" aus, anstatt es durch Prüfung alternativer Möglichkeiten zu validieren. Ein mögliches Beispiel hierfür finden Sie unter Prognose wiederkehrender Bestellungen für ein Online-Abonnementgeschäft mit Facebook Prophet und R.
5) Sinus und Cosinus sind eine undurchsichtige Art, mit Saisonalität umzugehen, während saisonale Effekte wie Wochentag, Wochentag, Wochentag, Monat des Monats sind viel effektiver / informativer im Umgang mit anthropogenen (Umgang mit Menschen!) Wirkungen.
Das Vorschlagen von Häufigkeiten von 365,25 für jährliche Muster ist wenig sinnvoll, da wir nicht genau am selben Tag wie im letzten Jahr dieselbe Aktion ausführen, während die monatliche Aktivität viel anhaltender ist, aber der Prophet scheint die 11 monatlichen Indikatoren nicht anzubieten Möglichkeit. Wöchentliche Häufigkeiten von 52 machen wenig Sinn, da wir nicht jedes Jahr 52 Wochen haben.
6) Es wird kein Versuch unternommen, Fehlerprozesse als Gauß'sch zu validieren, so dass aussagekräftige Signifikanztests durchgeführt werden können.
7) Keine Sorge, dass die Modellfehlervarianz homogen ist, dh sich zu bestimmten Zeitpunkten nicht deterministisch ändert, was auf gewichtete kleinste Quadrate hindeutet. Keine Sorge, eine optimale Leistungstransformation zu finden, um die Fehlervarianz proportional zum erwarteten Wert zu behandeln. Wann (und warum) sollten Sie das Protokoll einer Verteilung (von Zahlen) erstellen? .
8) Der Benutzer muss alle möglichen Lead- und Lag-Effekte für Ereignisse / Feiertage vorab festlegen. Beispielsweise steigt der tägliche Umsatz häufig Ende November, was auf die langfristigen Auswirkungen von Weihnachten zurückzuführen ist.
9) Keine Sorge, dass die resultierenden Fehler frei von Strukturen sind, die Möglichkeiten zur Verbesserung des Modells durch diagnostische Überprüfung auf Suffizienz vorschlagen.
10) Anscheinend keine Bedenken hinsichtlich der Verbesserung des Modells durch Löschen einer nicht signifikanten Struktur.
11) Es gibt keine Möglichkeit, eine Familie simulierter Prognosen zu erhalten, bei denen die Konfidenzgrenzen möglicherweise nicht unbedingt symmetrisch sind, indem die Fehler des Modells unter Berücksichtigung möglicher Anomalien gebootet werden.
12) Wenn der Benutzer Annahmen über Trends treffen kann (Anzahl der Trend-Haltepunkte und die tatsächlichen Haltepunkte), wird eine unerwünschte / unbrauchbare Flexibilität angesichts einer groß angelegten Analyse ermöglicht, die nach ihrem Namen für freihändige Großanwendungen konzipiert ist.