Ich habe eine Frage zur richtigen Verteilung, die zum Erstellen eines Modells mit meinen Daten verwendet werden soll. Ich führte eine Waldinventur mit 50 Parzellen durch, wobei jede Parzelle 20 m × 50 m misst. Für jedes Grundstück schätzte ich den Prozentsatz der Baumkronen, die den Boden beschatten. Jedes Grundstück hat einen Wert in Prozent für die Überdachung. Die Prozentsätze reichen von 0 bis 0,95. Ich mache ein Modell der prozentualen Baumkronenbedeckung ( Y- Variable) mit einer Matrix unabhängiger X- Variablen, die auf Satellitenbildern und Umgebungsdaten basieren.
Ich bin mir nicht sicher, ob ich eine Binomialverteilung verwenden soll, da eine Binomial-Zufallsvariable die Summe von n unabhängigen Versuchen ist (dh Bernoulli-Zufallsvariablen). Die Prozentwerte sind nicht die Summe der Versuche. Sie sind die tatsächlichen Prozentsätze. Sollte ich Gamma verwenden, obwohl es keine Obergrenze gibt? Sollte ich Prozentsätze in Ganzzahlen umwandeln und Poisson als Anzahl verwenden? Soll ich einfach bei Gauß bleiben? Ich habe nicht viele Beispiele in der Literatur oder in Lehrbüchern gefunden, die versuchen, Prozentsätze auf diese Weise zu modellieren. Hinweise oder Erkenntnisse sind willkommen.
Danke für deine Antworten. Tatsächlich ist die Beta-Distribution genau das, was ich brauche und wird in diesem Artikel ausführlich besprochen:
BN Eskelson, L. Madsen, JC Hagar & H. Temesgen (2011). Schätzung der Vegetationsbedeckung der Ufer mit Beta-Regressions- und Copula-Modellen. Forest Science, 57 (3), 212 & ndash; 221.
Diese Autoren verwenden das Betareg-Paket in R von Cribari-Neto und Zeileis.
Der folgende Artikel beschreibt eine gute Möglichkeit, eine Beta-verteilte Antwortvariable zu transformieren, wenn sie echte Nullen und / oder Einsen im Prozentbereich enthält:
- Smithson, M. und J. Verkuilen, 2006. Eine bessere Zitronenpresse? Maximum-Likelihood-Regression mit Beta-verteilten abhängigen Variablen , Psychological Methods, 11 (1): 54–71.