Ich habe gerade über das Abweichungsmaß für die logistische Regression gelesen. Der Teil, der als gesättigtes Modell bezeichnet wird, ist mir jedoch nicht klar.
Ich habe eine umfangreiche Google-Suche durchgeführt, aber keines der Ergebnisse hat meine Frage beantwortet. Bisher habe ich herausgefunden, dass ein gesättigtes Modell für jede Beobachtung einen Parameter hat, der zu einer perfekten Anpassung führt. Das ist mir klar. Aber: Weiterhin sind die angepassten Werte (eines gesättigten Modells) gleich den beobachteten Werten.
Da meines Wissens nach die logistische Regression zur Klassifizierung verwendet wird, sind die angegebenen beobachteten Daten Kovariaten mit zusätzlichen Bezeichnungen . Das Maß für die Abweichung verwendet jedoch Wahrscheinlichkeiten, nicht jedoch die tatsächlichen Bezeichnungen. Man wendet die berechnete vorhergesagte Wahrscheinlichkeit der logistischen Regression gegenüber den beobachteten Wahrscheinlichkeiten an. Da man jedoch nur Bezeichnungen anstelle von Wahrscheinlichkeiten angegeben hat, bin ich verwirrt, wie man aus diesen Bezeichnungen ein gesättigtes Modell konstruiert.