Ich bin neu auf der Seite und ziemlich neu in der Statistik und R. Ich arbeite an einem Projekt für das College mit dem Ziel, die Korrelation zwischen Regen und Wasserfluss in Flüssen zu finden. Sobald die Korrelation bewiesen ist, möchte ich sie vorhersagen.
Die Daten Ich habe einen Datensatz von mehreren Jahren (alle 5 Minuten) für einen bestimmten Fluss, der Folgendes enthält:
- Niederschlag in Millimetern
- Flussfluss in Kubikmetern pro Sekunde
Dieser Fluss hat keinen Schnee, daher basiert das Modell nur auf Regen und Zeit. Es gibt gelegentlich eisige Temperaturen, aber ich denke darüber nach, diese Zeiträume als Ausreißer aus den Daten zu entfernen, da diese Situation für mein Projekt nicht in Frage kommt.
Beispiele Hier finden Sie einige Diagramme mit Beispieldaten, die einige Stunden später von einem Regen und dem Aufstieg von Wasser stammen.
Die rote Linie ist der Flussfluss. Die Orange ist der Regen. Sie können sehen, dass es immer regnet, bevor Wasser im Fluss aufsteigt. Am Ende der Zeitreihe beginnt es wieder zu regnen, aber es wird später den Flussfluss beeinträchtigen.
Die Korrelation ist da. Folgendes habe ich in R getan, um die Korrelation mithilfe von ccf in R zu beweisen:
- die Kreuzkorrelation
- die führende Variable
- Die Verzögerung
Dies ist meine R-Linie für das zweite Beispiel (eine Niederschlagsperiode):
ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")
Meine Interpretation ist:
- dass der Regen führt (passiert zuerst),
ccf
Habe ich recht?
Über die Zeitreihe . Diese Zeitreihe hat keine Periodizität oder Saisonalität. Regen kann jederzeit kommen und eine Wirkung verursachen. Es nimmt im Sommer zwar ab, aber es kommt immer noch vor, dass es das ganze Jahr über viel regnet.
Modell und Prognose.
Ich weiß nicht, wie ich ein Modell erstellen soll, um eine Prognose zu erstellen, aus der hervorgeht, um wie viel ein Fluss das Volumen nach einer Regenperiode erhöhen wird. Ich habe es versucht arima
, war auto arima
aber nicht sehr erfolgreich. Soll ich Arima
, vars
oder verschiedenes anderes multivariaten Modell? Jeder Link zu einem Beispiel wäre eine große Hilfe.
Bitte lassen Sie mich wissen, wenn Sie wissen, wie diese Vorhersage am besten erstellt werden kann, welches Modell ich verwenden soll. Es gibt noch ein paar andere Dinge, die ich in Erwägung ziehe, aber der Einfachheit halber aus dieser Erklärung herausgenommen. Ich kann bei Bedarf einige Daten freigeben.