Wenn eine Antwort oder ein Ergebnis begrenzt ist, stellen sich bei der Anpassung eines Modells verschiedene Fragen, darunter die folgenden: Y
Jedes Modell, das Werte für die Antwort außerhalb dieser Grenzen vorhersagen könnte, ist im Prinzip zweifelhaft. Daher könnte ein lineares Modell problematisch sein, da es für die Prädiktoren und die Koeffizienten keine Grenzen für wenn die selbst in eine oder beide Richtungen unbegrenzt sind. Die Beziehung könnte jedoch schwach genug sein, um nicht zu beißen, und / oder Vorhersagen könnten innerhalb der Grenzen über den beobachteten oder plausiblen Bereich der Prädiktoren bleiben. In einem Extremfall spielt es kaum eine Rolle, zu welchem Modell man passt , wenn die Reaktion ein Mittelwert Rauschen ist.Y^=XbXbX+
Da die Antwort ihre Grenzen nicht überschreiten kann, ist eine nichtlineare Beziehung oft plausibler, da vorhergesagte Antworten nachlassen, um sich asymptotisch den Grenzen zu nähern. Sigmoidkurven oder -flächen, wie sie von Logit- oder Probit-Modellen vorhergesagt werden, sind in dieser Hinsicht attraktiv und sind jetzt nicht schwer anzupassen. Eine Antwort wie Alphabetisierung (oder Bruchteil, die eine neue Idee annimmt) zeigt häufig eine solche Sigmoidkurve zeitlich und plausibel mit fast jedem anderen Prädiktor.
Eine begrenzte Antwort kann nicht die Varianz-Eigenschaften haben, die bei einer einfachen oder Vanille-Regression erwartet werden. Wenn sich die mittlere Antwort der unteren und oberen Grenze nähert, nähert sich die Varianz notwendigerweise immer Null.
Ein Modell sollte entsprechend der Funktionsweise und dem Wissen über den zugrunde liegenden Erzeugungsprozess ausgewählt werden. Ob der Kunde oder das Publikum über bestimmte Modellfamilien Bescheid weiß, kann auch die Praxis leiten.
Beachten Sie, dass ich pauschale Urteile wie gut / nicht gut, angemessen / nicht angemessen, richtig / falsch absichtlich vermeide. Alle Modelle sind bestenfalls Näherungswerte, und welche Näherungswerte ansprechen oder für ein Projekt gut genug sind, ist nicht so einfach vorherzusagen. Normalerweise bevorzuge ich Logit-Modelle als erste Wahl für begrenzte Antworten, aber selbst diese Präferenz basiert teilweise auf Gewohnheit (z. B. das Vermeiden von Probit-Modellen ohne sehr guten Grund) und teilweise darauf, wo ich Ergebnisse melden werde, normalerweise an Leserschaften, die oder sollte statistisch gut informiert sein.
Ihre Beispiele für diskrete Skalen beziehen sich auf die Punkte 1-100 (bei Aufgaben, die ich markiere, ist 0 sicherlich möglich!) Oder auf die Ranglisten 1-17. Bei solchen Skalen würde ich normalerweise daran denken, kontinuierliche Modelle an Antworten anzupassen, die auf [0, 1] skaliert sind. Es gibt jedoch Praktiker von ordinalen Regressionsmodellen, die solche Modelle gerne an Skalen mit einer relativ großen Anzahl diskreter Werte anpassen würden. Ich bin froh, wenn sie antworten, wenn sie so interessiert sind.