Was Sie brauchen, ist eine solide Überprüfung der Regressionsmethode. Diese Fragen sind jedoch so grundlegend (verstehen Sie das nicht falsch), dass Ihnen wahrscheinlich sogar ein guter Überblick über grundlegende Statistiken zugute kommen würde. Howell hat ein sehr beliebtes Lehrbuch geschrieben , das eine breite konzeptionelle Grundlage bietet, ohne dass eine dichte Mathematik erforderlich ist. Es kann sich durchaus lohnen, es zu lesen. Es ist nicht möglich, das gesamte Material hier abzudecken. Ich kann jedoch versuchen, Sie mit einigen Ihrer spezifischen Fragen vertraut zu machen.
Erstens werden Wochentage über ein Codierungsschema eingeschlossen. Am beliebtesten ist die Codierung der Referenzkategorie (normalerweise als Dummy-Codierung bezeichnet). Stellen wir uns vor, Ihre Daten werden in einer Matrix dargestellt, mit Ihren Fällen in Zeilen und Ihren Variablen in Spalten. Wenn Sie in diesem Schema 7 kategoriale Variablen hätten (z. B. für Wochentage), würden Sie 6 neue Spalten hinzufügen. Sie würden einen Tag als Referenzkategorie auswählen, im Allgemeinen diejenige, die als Standardkategorie angesehen wird. Oft wird dies durch Theorie, Kontext oder die Forschungsfrage bestimmt. Ich habe keine Ahnung, welches für Wochentage am besten wäre, aber es ist auch nicht wirklich wichtig, man könnte einfach jedes alte auswählen. Sobald Sie die Referenzkategorie haben, können Sie die anderen Ihren neuen 6 Variablen zuweisen und dann einfach angeben, ob diese Variable für jeden Fall erhalten wird. Angenommen, Sie wählen Sonntag als Referenzkategorie aus. Ihre neuen Spalten / Variablen wären Montag bis Samstag. Jede Beobachtung, die an einem Montag stattfand, würde mit einem gekennzeichnet1010
Es ist lange her, dass ich mir angesehen habe, wie Excel Statistiken erstellt, und ich erinnere mich nicht genau daran, sodass Ihnen möglicherweise jemand anderes dort weiterhelfen kann. Diese Seite scheint einige Informationen zu den Besonderheiten der Regression in Excel zu enthalten. Ich kann Ihnen etwas mehr über die Statistiken erzählen, die normalerweise in der Regressionsausgabe gemeldet werden:
- r1
- rrrrr
- rr×r10r1R21rR2) ist stark voreingenommen in multiple Regression. Das heißt, je mehr Prädiktoren Sie Ihrem Modell hinzufügen, desto höher sind diese Statistiken, unabhängig davon, ob eine Beziehung besteht oder nicht. Daher sollten Sie bei der Interpretation vorsichtig sein.
- tF
- p
- tFpF1F
- FF
Ein letzter hervorzuhebender Punkt ist, dass dieser Prozess nicht von seinem Kontext getrennt werden kann. Um Daten gut analysieren zu können, müssen Sie Ihr Hintergrundwissen und die Forschungsfrage berücksichtigen. Ich habe oben in Bezug auf die Wahl der Referenzkategorie darauf hingewiesen. Zum Beispiel stellen Sie fest, dass die Schuhgröße nicht relevant sein sollte, aber für die Flintstones war es wahrscheinlich! Ich möchte diese Tatsache nur einbeziehen, weil sie oft vergessen zu sein scheint.