Skaleninvariante Analyse von Zeitreihen


8

Ist es bei der Entwicklung einer Allzweck-Zeitreihensoftware eine gute Idee, sie skalierungsinvariant zu machen? Wie würde man das machen?

Ich nahm eine Zeitreihe von ungefähr 40 Punkten und multiplizierte sie dann mit Faktoren zwischen 10E-9 und 10E3. Anschließend durchlief ich die ARIMA-Funktionen von Forecast Pro und Minitab. In Forecast Pro ergaben alle dieselbe Antwort (automatische Modellierung), in Minitab jedoch nicht. Sie sind sich nicht sicher, was Forecast Pro tut, aber sie skalieren möglicherweise alle Zahlen auf einen bestimmten Maßstab (sagen wir 100s), bevor Sie das Modell ausführen. Ist das eine gute Idee im Allgemeinen?

Antworten:


7

Wenn die Software die Summe der quadratischen Fehler bei der Optimierung berechnet (und die meisten werden dies tun), können Probleme mit sehr großen oder sehr kleinen Zahlen auftreten, da Gleitkommazahlen gespeichert werden. Gleiches gilt für jede statistische Modellierung, nicht nur für die Zeitreihenanalyse. Eine Möglichkeit, das Problem zu vermeiden, besteht darin, die Daten vor dem Ausführen des Modells zu skalieren und die Ergebnisse anschließend neu zu skalieren. Für die meisten Zeitreihenmodelle, einschließlich aller linearen Modelle, funktioniert dies. Einige nichtlineare Modelle lassen sich jedoch nicht skalieren.

Wenn ich Daten analysiere, skaliere ich die Daten häufig selbst, um mögliche Optimierungsprobleme nicht nur zu vermeiden, sondern auch um das Lesen von Grafiken und Tabellen zu erleichtern.


1
Darüber hinaus möchten Sie vielleicht lesen, was jeder Informatiker über Gleitkomma-Arithmetik von David Goldberg wissen sollte, um Ratschläge zum Umgang mit Fragen der numerischen Darstellung zu erhalten.
Mark

@Rob: Danke für die Antwort. Ich denke, Sie implizieren dann, dass es in Ordnung ist, die Serie vor der Analyse zu skalieren.
Samik R

@fmark: Danke für den Kommentar - ich kenne dieses Material eigentlich ziemlich gut.
Samik R

@Samik: Für lineare Modelle wie Gaußsche ARIMA-Prozesse ja.
Rob Hyndman

3
In weiten Grenzen macht die Skalierung für Gleitkommaberechnungen überhaupt keinen Unterschied: Sie läuft einfach auf eine Verschiebung des Exponenten ohne Genauigkeitsverlust hinaus. Wenn eine Skalierung hilfreich sein kann, umfasst eine Berechnung Datensätze, die sich selbst auf unterschiedlichen Maßstäben befinden. Ich vermute, dass die Zeitreihenformeln eine Zeitmessung verwenden (Millisekunden? Jahre? Nur ganzzahlige Schritte?), Die möglicherweise einen ganz anderen Bereich als der Bereich der Daten aufweist. Gute Statistiken SW skaliert seine Matrizen intern, um Präzisionsverluste zu vermeiden. Dies könnte die Unterschiede zwischen FP und Minitab erklären.
whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.