Wie verteilt sich der Fehler auf logistische Wachstumsdaten?


10

In der Ökologie verwenden wir häufig die logistische Wachstumsgleichung:

Nt=KN0ertK+N0ert1

oder

Nt=KN0N0+(KN0)ert

wobei die Tragfähigkeit ist (maximale Dichte erreicht), die Anfangsdichte ist, die Wachstumsrate ist, die Zeit seit dem Anfang ist.N 0 r tKN0rt

Der Wert vonNt hat eine weiche Obergrenze und eine Untergrenze mit einer starken Untergrenze bei .( N 0 ) 0(K)(N0)0

Darüber hinaus werden in meinem spezifischen Kontext Messungen von unter Verwendung der optischen Dichte oder Fluoreszenz durchgeführt, die beide theoretische Maxima und damit eine starke Obergrenze aufweisen.Nt

Der Fehler um wird daher wahrscheinlich am besten durch eine begrenzte Verteilung beschrieben.Nt

Bei kleinen Werten von weist die Verteilung wahrscheinlich einen starken positiven Versatz auf, während bei Werten vonN tNtNt auf sich K nähern, die Verteilung wahrscheinlich einen starken negativen Versatz aufweist. Die Verteilung hat also wahrscheinlich einen Formparameter, der mit verknüpft werden .Nt

Die Varianz kann auch mit .Nt

Hier ist ein grafisches Beispiel

Geben Sie hier die Bildbeschreibung ein

mit

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

welches in r mit produziert werden kann

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • Was wäre die theoretische Fehlerverteilung um Nt (unter Berücksichtigung sowohl des Modells als auch der bereitgestellten empirischen Informationen)?

  • Wie hängen die Parameter dieser Verteilung mit dem Wert von oder der Zeit zusammen (wenn Parameter verwendet werden, kann der Modus nicht direkt zugeordnet werdenN tNtNt z. B. logis normal)?

  • Hat diese Verteilung eine in implementierte DichtefunktionR ?

Bisher erkundete Richtungen:

  • Unter der Annahme einer Normalität um (führt zu Überschätzungen von K.NtK )
  • Logit Normalverteilung um Nt/max , aber Schwierigkeiten beim Anpassen der Formparameter Alpha und Beta
  • Normalverteilung um die Logik vonNt/max

1
KrNtt

@whuber, ich habe versucht, einige Ihrer Kommentare in einer kürzlichen Bearbeitung zu adressieren.
Etienne Low-Décarie

1
5 Denken Sie, wenn Sie die Eigenschaften der Rauschverteilung so charakterisieren können, wie Sie es haben, können Sie mit diesen Eigenschaften eine parametrische Form auswählen. Ich denke, um die Familie zusammenzufassen, muss 1. in einem endlichen Intervall definiert werden, 2. Linksversatz, Rechtsversatz und Symmetrie zulassen. und 3. eine Varianz hat, die mit zunehmendem Nt zunimmt. Die Beta-Verteilung passt zur Rechnung für 1 und 2. Das feste Intervall ist [0, 1]. Um die Varianz zu erhöhen, könnten wir einen Parameter c hinzufügen, der die Verteilung auf die Intervalle verteilt [0, c].
Michael R. Chernick

Antworten:


3

Wie Michael Chernick betonte, ist die skalierte Beta-Verteilung hierfür am sinnvollsten. Für alle praktischen Zwecke und in der Erwartung, dass Sie es tun werden NIE tun werdenWenn Sie das Modell perfekt richtig machen, ist es besser, den Mittelwert einfach durch nichtlineare Regression gemäß Ihrer logistischen Wachstumsgleichung zu modellieren und dies mit Standardfehlern abzuschließen, die gegenüber Heteroskedastizität robust sind. Wenn Sie dies in einen Kontext mit maximaler Wahrscheinlichkeit setzen, entsteht ein falsches Gefühl von großer Genauigkeit. Wenn die ökologische Theorie eine Verteilung ergeben würde, sollten Sie diese Verteilung anpassen. Wenn Ihre Theorie nur die Vorhersage für den Mittelwert liefert, sollten Sie sich an diese Interpretation halten und nicht versuchen, mehr als das zu finden, wie eine vollständige Verteilung. (Pearsons Kurvensystem war sicherlich vor 100 Jahren ausgefallen, aber zufällige Prozesse folgen keinen Differentialgleichungen, um die Dichtekurven zu erzeugen, was seine Motivation bei diesen Dichtekurven war - vielmehrNtmuss eine Obergrenze haben; Ich würde eher sagen, dass der von Ihren Geräten verursachte Messfehler kritisch wird, wenn der Prozess die Obergrenze für eine einigermaßen genaue Messung erreicht. Wenn Sie die Messung mit dem zugrunde liegenden Prozess verwechseln, sollten Sie dies explizit erkennen, aber ich würde mir vorstellen, dass Sie ein größeres Interesse an dem Prozess haben als an der Beschreibung der Funktionsweise Ihres Geräts. (Der Prozess wird in 10 Jahren dort sein. Möglicherweise werden neue Messgeräte verfügbar, sodass Ihre Arbeit veraltet ist.)


Vielen Dank! Ich stimme zu, dass eine Trennung von Prozess und Maßnahme interessant ist. Ich würde jedoch vorschlagen, dass die meisten Messmethoden diese starke Obergrenze haben, aber es könnte wichtig sein, diese zu isolieren. Wenn ich die skalierte Beta verwenden möchte, gibt es trotz Ihrer Warnung vor dem Vertrauen in die MLE-Anpassung Vorschläge, wie die Formparameter mit diesem System in Beziehung gesetzt werden können, um Variablen zu modellieren, die MLE ermöglichen?
Etienne Low-Décarie

Wenn Sie davon überzeugt sind, dass Ihre Grenzen in Ihrer Anwendung wirklich wichtig sind, können Sie sich einfach an diese skalierte Beta halten. Ich sage nur, dass ich nicht überzeugt bin. Es gibt Modelle für abgeschnittene Daten, bei denen Sie lediglich wissen, dass der tatsächliche Wert das Maximum überschreitet, das Sie messen können. Sie werden manchmal zusammen mit der Top-Kodierung der Einkommen verwendet, während aus Gründen der Vertraulichkeit die Einkommen über 100.000 USD / Jahr auf 100.000 USD / Jahr gekürzt werden.
StasK

1

@whuber ist richtig, dass es keine notwendige Beziehung des strukturellen Teils dieses Modells zur Verteilung der Fehlerterme gibt. Es gibt also keine Antwort auf Ihre Frage zur theoretischen Fehlerverteilung.

Dies bedeutet jedoch nicht, dass es keine gute Frage ist - nur, dass die Antwort weitgehend empirisch sein muss.

Sie scheinen anzunehmen, dass die Zufälligkeit additiv ist. Ich sehe keinen Grund (außer Rechenaufwand) dafür. Gibt es eine Alternative, dass es irgendwo anders im Modell ein zufälliges Element gibt? Siehe zum Beispiel das Folgende, wo Zufälligkeit als Normalverteilung mit dem Mittelwert 1 eingeführt wird, wobei nur die Varianz geschätzt werden muss. Ich habe keinen Grund zu der Annahme, dass dies das Richtige ist, außer dass es plausible Ergebnisse liefert, die mit dem übereinstimmen, was Sie sehen möchten. Ob es praktisch wäre, so etwas als Grundlage für die Schätzung eines Modells zu verwenden, weiß ich nicht.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

Geben Sie hier die Bildbeschreibung ein


In diesem Fall könnten Sie Nt-Werte unter Null und über der harten oberen Grenze haben. Darüber hinaus wird in allen Parametern Rauschen erwartet (nicht unbedingt im Produkt eines zeitlichen Parameters), daher das Rauschen in der Antwortvariablen. Ich wäre immer noch an der Maximum-Likelihood-Interpretation Ihres Ansatzes interessiert.
Etienne Low-Décarie

Dies erlaubt nicht, dass die Verteilung für jedes Nt begrenzt wird, und erlaubt nicht, dass die Rauschkomponente verzerrt wird. Ich weiß nicht, ob meine Idee einer skalierten Beta-Distribution in der Literatur verwendet wurde, aber sie erfüllt die Einschränkungen gut. Ich habe es nicht ausprobiert, aber vielleicht könnte die maximale Wahrscheinlichkeit versucht werden. Ich bin nicht sicher, aber vielleicht würde es ein Problem geben, wenn c in die Wahrscheinlichkeitsschätzung einbezogen wird. Vielleicht könnte c nur basierend auf Nt separat geschätzt werden, und dann könnte der Rest des Modells mit maximaler Wahrscheinlichkeit für jedes feste Nt angepasst werden.
Michael R. Chernick

Ich denke nur laut nach. Glaubt jemand, dass dieses Problem in ein gutes Forschungspapier verwandelt werden könnte?
Michael R. Chernick

Eine Zeitung aus dem Jahr 1966 hat sich ein wenig damit befasst, aber ich habe keine neuere gesehen. Ich habe mich vielleicht seitdem geändert? jstor.org/discover/10.2307/…
Etienne Low-Décarie

Bitte lassen Sie mich wissen, wenn Sie sich für diesen Weg entscheiden.
Etienne Low-Décarie
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.