ANOVA mit festen Effekten (oder sein lineares Regressionsäquivalent) bietet eine leistungsstarke Methodenfamilie zur Analyse dieser Daten. Zur Veranschaulichung ist hier ein Datensatz, der mit den Darstellungen der mittleren HC pro Abend übereinstimmt (eine Darstellung pro Farbe):
| Color
Day | B G R | Total
-------+---------------------------------+----------
1 | 117 176 91 | 384
2 | 208 193 156 | 557
3 | 287 218 257 | 762
4 | 256 267 271 | 794
5 | 169 143 163 | 475
6 | 166 163 163 | 492
7 | 237 214 279 | 730
8 | 588 455 457 | 1,500
9 | 443 428 397 | 1,268
10 | 464 408 441 | 1,313
11 | 470 473 464 | 1,407
12 | 171 185 196 | 552
-------+---------------------------------+----------
Total | 3,576 3,323 3,335 | 10,234
ANOVA von count
gegen day
und color
produziert diese Tabelle:
Number of obs = 36 R-squared = 0.9656
Root MSE = 31.301 Adj R-squared = 0.9454
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 605936.611 13 46610.5085 47.57 0.0000
|
day | 602541.222 11 54776.4747 55.91 0.0000
colorcode | 3395.38889 2 1697.69444 1.73 0.2001
|
Residual | 21554.6111 22 979.755051
-----------+----------------------------------------------------
Total | 627491.222 35 17928.3206
Der model
p-Wert von 0,0000 zeigt, dass die Anpassung hoch signifikant ist. Der day
p-Wert von 0,0000 ist ebenfalls von hoher Bedeutung: Sie können tägliche Änderungen erkennen. Der color
(Semester-) p-Wert von 0,2001 sollte jedoch nicht als signifikant angesehen werden: Sie können keinen systematischen Unterschied zwischen den drei Semestern feststellen, selbst nachdem Sie die tägliche Variation kontrolliert haben.
Tukeys HSD- Test ("ehrlicher signifikanter Unterschied") identifiziert die folgenden signifikanten Änderungen (unter anderem) der täglichen Mittelwerte (unabhängig vom Semester) auf dem Niveau von 0,05:
1 increases to 2, 3
3 and 4 decrease to 5
5, 6, and 7 increase to 8,9,10,11
8, 9, 10, and 11 decrease to 12.
Dies bestätigt, was das Auge in den Grafiken sehen kann.
Da die Diagramme ziemlich viel herumspringen, gibt es keine Möglichkeit, alltägliche Korrelationen (serielle Korrelation) zu erkennen, was den gesamten Zeitpunkt der Zeitreihenanalyse darstellt. Mit anderen Worten, beschäftigen Sie sich nicht mit Zeitreihentechniken: Es gibt hier nicht genügend Daten, um einen besseren Einblick zu erhalten.
Man sollte sich immer fragen, wie sehr man den Ergebnissen einer statistischen Analyse glauben kann. Verschiedene Diagnosen für Heteroskedastizität (wie der Breusch-Pagan-Test ) zeigen nichts Unangenehmes. Die Residuen sehen nicht sehr normal aus - sie gruppieren sich in einige Gruppen - daher müssen alle p-Werte mit einem Salzkorn gemessen werden. Trotzdem scheinen sie eine vernünftige Anleitung zu bieten und dabei zu helfen, den Sinn der Daten zu quantifizieren, die wir durch Betrachten der Grafiken erhalten können.
Sie können eine parallele Analyse der täglichen Minima oder der täglichen Maxima durchführen. Stellen Sie sicher, dass Sie mit einem ähnlichen Diagramm als Richtlinie beginnen und die statistische Ausgabe überprüfen.