Wahre Bedeutung der Vertrauensellipse


12

Wenn ich über die wahre Bedeutung der 95% igen Vertrauensellipse lese, finde ich in der Regel zwei Erklärungen:

  1. Die Ellipse, die 95% der Daten enthält
  2. Nicht das Obige, sondern die Ellipse, die die Varianz der Daten erklärt. Ich bin nicht sicher, ob ich das richtig verstehe, aber sie scheinen zu bedeuten, dass bei einem neuen Datenpunkt eine Wahrscheinlichkeit von 95% besteht, dass die neue Varianz in der Ellipse bleibt.

Kannst du Licht ins Dunkel bringen?

Antworten:


15

Eigentlich ist keine Erklärung richtig.

Eine Vertrauensellipse hat mit nicht beobachteten Populationsparametern zu tun , wie dem wahren Populationsmittel Ihrer bivariaten Verteilung. Eine 95% -Konfidenzellipse für diesen Mittelwert ist in Wirklichkeit ein Algorithmus mit der folgenden Eigenschaft: Wenn Sie Ihre Stichprobe mehrmals aus der zugrunde liegenden Verteilung replizieren und jedes Mal eine Konfidenzellipse berechnen würden, würden 95% der so konstruierten Ellipsen den zugrunde liegenden Wert enthalten bedeuten. (Beachten Sie, dass jede Probe natürlich eine andere Ellipse ergeben würde.)

Daher enthält eine Vertrauensellipse normalerweise nicht 95% der Beobachtungen. Tatsächlich wird der Mittelwert mit zunehmender Anzahl von Beobachtungen in der Regel immer besser geschätzt, was zu immer kleineren Vertrauensellipsen führt, die wiederum einen immer kleineren Anteil der tatsächlichen Daten enthalten. (Leider berechnen einige Leute die kleinste Ellipse, die 95% ihrer Daten enthält und an ein Quantil erinnert, was für sich genommen ganz in Ordnung ist. Dann bezeichnen sie diese "Quantilellipse" jedoch als "Vertrauensellipse". wie Sie sehen, führt zu Verwirrung.)

Die Varianz der Grundgesamtheit bezieht sich auf die Vertrauensellipse. Hohe Varianz bedeutet, dass die Daten überall vorhanden sind, sodass der Mittelwert nicht gut geschätzt wird und die Konfidenzellipse größer ist, als wenn die Varianz kleiner wäre.

Natürlich können wir Konfidenzellipsen auch für jeden anderen Populationsparameter berechnen, den wir schätzen möchten. Oder wir könnten andere Vertrauensbereiche als Ellipsen betrachten, insbesondere wenn wir nicht wissen, dass der geschätzte Parameter (asymptotisch) normalverteilt ist.

Das eindimensionale Analogon der Vertrauensellipse ist das Durchsuchen der vorherigen Fragen in diesem Tag ist hilfreich. Besonders schön ist unsere aktuelle, am häufigsten gestellte Frage in diesem Tag: Warum impliziert ein 95% CI keine 95% ige Chance, den Mittelwert zu enthalten? Der größte Teil der dortigen Diskussion gilt auch für höherdimensionale Analoga des eindimensionalen Konfidenzintervalls.


1

Es kommt auf den Bereich an, für den dieses Konzept gilt. Was oben gesagt wurde, gilt für Statistiken, aber wenn wir Statistiken auf andere Themen anwenden, ist das etwas anders. In der Biomechanik verwenden wir beispielsweise den Begriff Vertrauensellipse (obwohl diskutiert wird, ob es sich um eine Vorhersageellipse handeln soll) als Methode zur Messung des Druckverlagerungszentrums, wenn ein Subjekt auf einer Kraftplattform steht. Dann soll die Ellipse, die um die beiden Achsen (Dur und Moll) gezeichnet wird, die 95% der Datenpunkte enthalten, die den Mittelpunkt der Druckverschiebung während eines Versuchs darstellen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.