Abhängige Variable
Ich habe einen abhängigen Wert im Bereich von [0,1]. Bedeutung 0 und 1, und alle Werte dazwischen sind enthalten. Daher ist dies ein proportionaler Wert, wie zum Beispiel der Prozentsatz des Landes, das ein Landwirt düngt.
Modell
Das Modell, auf das ich mich derzeit konzentriere, ist ein logistisches Modell.
- Als Ausgabe möchte ich jedoch sehen, wie meine abhängige Variable vom Modell vorhergesagt wird (um die realen Werte mit den geschätzten Werten zu vergleichen).
Eine logistische Regression gibt jedoch normalerweise als Ausgabe "die Wahrscheinlichkeit" an. Infolgedessen bin ich jetzt ein bisschen verwirrt.
Mein Modell =
out <- glm(cbind(fertilized, total_land-fertilized) ~ X-variables,
family=binomial(cloglog), data=Alldata)
Um den geschätzten Prozentsatz an gedüngtem Land vorherzusagen, benutze ich
Alldata$estimated_fertilized<-predict(out,data=newdata,type="response"))
Ist das richtig? Oder gibt mir diese Zeile die Wahrscheinlichkeit anstelle des vorhergesagten Prozentsatzes? Wenn nicht richtig, was soll ich tun, um das zu bekommen, was ich will?
AKTUALISIEREN
Angesichts der Tatsache, dass Fragen zur Richtigkeit des ausgewählten Modells bestehen, gebe ich einige zusätzliche Informationen: