Noch eine Frage zu Zeitreihen von mir.
Ich habe einen Datensatz, der täglich Aufzeichnungen über gewalttätige Vorfälle in einer psychiatrischen Klinik über drei Jahre enthält. Mit Hilfe meiner vorherigen Frage habe ich daran herumgespielt und bin jetzt ein bisschen glücklicher darüber.
Das, was ich jetzt habe, ist, dass die tägliche Serie sehr laut ist. Es schwankt wild auf und ab, von 0 zu Zeiten bis zu 20. Mit Lössplots und dem Prognosepaket (das ich Anfängern wie mir sehr empfehlen kann) erhalte ich nur eine völlig flache Linie mit massiven Konfidenzintervallen aus der Prognose.
Die wöchentliche oder monatliche Zusammenfassung der Daten ist jedoch viel sinnvoller. Sie kehren vom Beginn der Serie an nach unten und nehmen dann in der Mitte wieder zu. Lössplot und das Prognosepaket ergeben beide etwas, das viel aussagekräftiger aussieht.
Es fühlt sich allerdings ein bisschen nach Betrug an. Bevorzuge ich nur die aggregierten Versionen, weil sie ohne wirkliche Gültigkeit gut aussehen?
Oder wäre es besser, einen gleitenden Durchschnitt zu berechnen und diesen als Grundlage zu verwenden? Ich fürchte, ich verstehe die Theorie dahinter nicht gut genug, um zuversichtlich zu sein, was akzeptabel ist