Eines der wichtigen Themen von Meteorologen konfrontiert wird , wenn die gegebene Serie kann prognostiziert werden oder nicht?
Ich bin auf einen Artikel mit dem Titel " Entropie als A-priori-Indikator für die Vorhersagbarkeit " von Peter Catt gestoßen , in dem die ungefähre Entropie (ApEn) als relatives Maß zur Bestimmung einer bestimmten Zeitreihe verwendet wird.
Der Artikel sagt:
"Kleinere ApEn-Werte zeigen eine größere Wahrscheinlichkeit an, dass auf einen Datensatz ähnliche Daten folgen (Regelmäßigkeit). Umgekehrt zeigt ein größerer Wert von ApEn eine geringere Wahrscheinlichkeit an, dass ähnliche Daten wiederholt werden (Unregelmäßigkeit). Daher vermitteln größere Werte mehr Unordnung , Zufälligkeit und Systemkomplexität. "
Und es folgen mathematische Formeln zur Berechnung von ApEn. Dies ist ein interessanter Ansatz, da er einen numerischen Wert liefert, mit dem die Prognosefähigkeit im relativen Sinne bewertet werden kann. Ich weiß nicht, was ungefähre Entropie bedeutet, ich lese mehr darüber.
Es gibt ein Paket namens pracma in , R
dass Sie ApEn berechnen lässt. Zur Veranschaulichung habe ich 3 verschiedene Zeitreihen verwendet und die ApEn-Zahlen berechnet.
- Serie 1: Die berühmte AirPassenger-Zeitreihe - ist sehr deterministisch und wir sollten leicht vorhersagen können.
- Serie 2: Sunspot-Zeitreihen - sind sehr gut definiert, sollten jedoch weniger vorhersehbar sein als Serie 1.
- Serie 3: Zufallszahl Es gibt keine Möglichkeit, diese Serie vorherzusagen.
Wenn wir also ApEn berechnen, sollte Serie 1 kleiner sein als Serie 2 sehr, sehr viel weniger Serie 3.
Unten sehen Sie das R-Snippet, das ApEn für alle drei Serien berechnet.
library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609
Das habe ich nicht erwartet. Die Zufallsreihe hat eine niedrigere Anzahl als die gut definierte AirPassenger-Reihe. Selbst wenn ich die Zufallszahl auf 100 erhöhe, erhalte ich immer noch Folgendes, was weniger ist als die gut definierte Serie 2 / Sunspot.yealry.
> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275
Unten sind meine Fragen:
- Es gibt 2 Parameter bei der Berechnung von ApEn (
m
undr
)? Wie man sie bestimmt. Ich habe die Standardeinstellungen imR
obigen Code verwendet. - Was mache ich falsch, das zeigt falsch, dass ApEn für Zufallszahlen niedriger ist als für eine gut definierte Serie wie sunspot.yearly.
- Sollte ich die Serie deseasonalisieren / abwerten und dann ApEn schätzen? Der Autor hat ApEn jedoch direkt auf die Serie angewendet.
- Gibt es eine andere Möglichkeit, um festzustellen, ob die Serie vorhersehbar ist?