Ich bin mit dem Konzept der kategorialen Variablen und der jeweiligen Dummy-Variablencodierung vertraut, die es uns ermöglicht, eine Ebene als Basislinie anzupassen, um Kollinearität zu vermeiden. Ich bin auch mit der Interpretation von Parameterschätzungen aus solchen Modellen vertraut: Die vorhergesagte Änderung des Ergebnisses für eine bestimmte angepasste Ebene des kategorialen Prädiktors relativ zur Basiskategorie.
Ich bin mir nicht sicher, wie ich eine Reihe unabhängiger Variablen interpretieren soll , deren Proportionen eins ergeben . Wir haben wieder Kollinearität, wenn wir alle Proportionen in das Modell einpassen, also müssten wir vermutlich eine Kategorie als Basislinie weglassen. Ich gehe auch davon aus, dass ich den Typ III SS für den Gesamttest der Signifikanz dieser Variablen betrachten würde. Wie interpretieren wir jedoch die Parameterschätzungen für diese Ebenen, die in das Modell passen, im Vergleich zu denen, die als Basis betrachtet werden?
Ein Beispiel : Auf der Ebene der Postleitzahl ist die unabhängige Variable der Anteil an metamorphem, magmatischem und sedimentärem Gestein. Wie Sie vielleicht wissen, sind dies die drei Hauptgesteinsarten, und alle Gesteine werden als eine davon klassifiziert. Als solches summieren sich die Proportionen über alle drei zu 1. Das Ergebnis ist der durchschnittliche Radongehalt in einer jeweiligen Postleitzahl.
Wenn ich beispielsweise die metamorphen und magmatischen Proportionen als Prädiktoren in das Modell einpassen würde und Sediment als Basislinie belassen würde, würde ein SS F- Test vom Typ III der beiden angepassten Ebenen insgesamt anzeigen, ob der Gesteinstyp insgesamt wichtig ist Prädiktor des Ergebnisses (durchschnittlicher Radonspiegel). Dann könnte ich die einzelnen p- Werte (basierend auf der t- Verteilung) untersuchen, um festzustellen, ob sich einer oder beide Gesteinsarten signifikant von der Grundlinie unterscheiden.
Wenn es jedoch um die Parameterschätzungen geht, möchte mein Gehirn sie immer wieder nur als vorhergesagte Änderung des Ergebnisses zwischen Gruppen (Gesteinsarten) interpretieren, und ich verstehe nicht, wie ich die Tatsache berücksichtigen soll, dass sie als Proportionen passen .
Hat jemand eine Quelle, die die Interpretation eines solchen Modells liefert, oder könnten Sie hier ein kurzes Beispiel geben, wenn nicht?