Die Windrichtung (hier in Grad gemessen, vermutlich als Kompassrichtung im Uhrzeigersinn von Norden) ist eine kreisförmige Variable. Der Test ist, dass der konventionelle Anfang der Skala derselbe ist wie das Ende, dh . Wenn es als Prädiktor behandelt wird, ist es wahrscheinlich am besten auf Sinus und Cosinus abgebildet. Unabhängig von Ihrer Software ist es wahrscheinlich, dass Winkel im Bogenmaß gemessen werden, sodass die Konvertierung in etwa gleichwertig ist0∘= 360∘
Sünde( π Richtung / 180 ) , cos( π Richtung / 180 )
2 π= 360∘
Sünde( π Zeit / 12 ) , cos( π Zeit / 12 )
oder
Sünde( π( Zeit + 0,5 ) / 12 ) , cos( π( Zeit + 0,5 ) / 12 )
je nachdem wie genau die zeit erfasst wurde oder interpretiert werden soll.
Manchmal ist die Natur oder die Gesellschaft zuvorkommend und die Abhängigkeit von der kreisförmigen Variablen nimmt die Form einer Richtung an, die für die Reaktion optimal ist, und die entgegengesetzte Richtung (der halbe Kreis ist entfernt) ist pessimal. In diesem Fall kann ein einzelner Sinus- und Cosinus-Ausdruck ausreichen. Für kompliziertere Muster benötigen Sie möglicherweise andere Begriffe. Für viel mehr ins Detail ein Tutorial auf dieser Technik von Kreis-, Fourier, periodisch, trigonometrischer Regression fand sich hier , mit wiederum weiteren Referenzen. Die gute Nachricht ist, dass einmal erstellte Sinus- und Cosinus-Terme nur zusätzliche Prädiktoren für Ihre Regression sind.
Es gibt eine große Literatur zur Zirkelstatistik, die selbst als Teil der Richtungsstatistik angesehen wird. Seltsamerweise wird diese Technik häufig nicht erwähnt, da der Schwerpunkt in dieser Literatur üblicherweise auf zirkulären Antwortvariablen liegt. Das Zusammenfassen von zirkulären Variablen mit ihren Vektormitteln ist eine beschreibende Standardmethode, für die Regression jedoch nicht erforderlich oder direkt hilfreich.
Einige Details zur Terminologie Windrichtung und Tageszeit sind statistisch gesehen Variablen, keine Parameter, unabhängig von der Verwendung in Ihrem Fachgebiet.
yXββX[ - 1 , 1 ]
Zufälliger Kommentar Für eine Antwortvariable wie die Partikelkonzentration würde ich erwarten, ein verallgemeinertes lineares Modell mit logarithmischer Verknüpfung zu verwenden, um positive Vorhersagen zu gewährleisten.