Die eigentliche Bedeutung von Frage (5) hängt von einer unbekannten Interpretation von "Vertrauen" ab. Ich habe das Papier sorgfältig durchsucht und keinen Versuch gefunden, "Vertrauen" zu definieren oder was es in diesem Zusammenhang bedeuten könnte. Die Erklärung des Papiers zu seiner Antwort auf Frage (5) lautet
"... [es] erwähnt die Grenzen des CI, während ... ein CI verwendet werden kann, um nur das Verfahren und kein bestimmtes Intervall zu bewerten."
Dies ist sowohl fälschlich als auch irreführend. Erstens, wenn Sie das Ergebnis des Verfahrens nicht beurteilen können, was nützt das Verfahren dann überhaupt? Zweitens geht es bei der Aussage in der Frage nicht um das Verfahren, sondern um das "Vertrauen" des Lesers in seine Ergebnisse.
Die Autoren verteidigen sich:
Bevor Sie fortfahren, müssen Sie sich an die korrekte Definition eines CI erinnern. Ein CI ist ein numerisches Intervall, das um die Schätzung eines Parameters erstellt wird. Ein solches Intervall zeigt jedoch nicht direkt eine Eigenschaft des Parameters an, sondern es zeigt an eine Eigenschaft des Verfahrens, wie sie für eine frequentistische Technik typisch ist. "
Ihre Voreingenommenheit zeigt sich in der letzten Phrase: "frequentistische Technik" (vielleicht mit einem impliziten Spott geschrieben). Obwohl diese Charakterisierung korrekt ist, ist sie kritisch unvollständig. Es fällt nicht auf, dass ein Konfidenzintervall auch eine Eigenschaft der experimentellen Methoden (wie Proben entnommen und gemessen wurden) und, was noch wichtiger ist, der Natur selbst ist. Das ist der einzige Grund, warum sich irgendjemand für seinen Wert interessieren würde.
Ich hatte kürzlich das Vergnügen, Edward Batschelets Circular Statistics in Biology (Academic Press, 1981) zu lesen . Batschelet schreibt klar und auf den Punkt, in einem Stil, der sich an den arbeitenden Wissenschaftler richtet. Folgendes sagt er über Konfidenzintervalle:
" Eine Schätzung eines Parameters ohne Hinweise auf Abweichungen aufgrund von Zufallsschwankungen hat wenig wissenschaftlichen Wert. ...
"Während der zu schätzende Parameter eine feste Zahl ist, werden die Konfidenzgrenzen von der Stichprobe bestimmt. Sie sind statistisch und daher von zufälligen Schwankungen abhängig. Unterschiedliche Stichproben aus derselben Grundgesamtheit führen zu unterschiedlichen Konfidenzintervallen."
[Der Schwerpunkt liegt im Original auf den Seiten 84-85.]
Beachten Sie den Unterschied in der Betonung: Während sich das fragliche Papier auf das Verfahren konzentriert , konzentriert sich Batschelet auf die Stichprobe und insbesondere darauf, was sie über den Parameter aussagen kann und inwieweit diese Informationen durch "zufällige Schwankungen" beeinflusst werden können. Ich finde diesen unbefangen praktischen, wissenschaftlichen Ansatz weitaus konstruktiver, aufschlussreicher und letztendlich auch nützlicher.
Eine umfassendere Charakterisierung von Konfidenzintervallen als in der Veröffentlichung angegeben, müsste daher in etwa so erfolgen:
Ein CI ist ein numerisches Intervall, das um die Schätzung eines Parameters erstellt wird. Jeder, der mit den der CI-Konstruktion zugrunde liegenden Annahmen einverstanden ist, kann mit Recht sagen, dass er zuversichtlich ist, dass der Parameter innerhalb des Intervalls liegt: Dies ist die Bedeutung von "zuversichtlich". Diese Bedeutung entspricht im Großen und Ganzen den herkömmlichen nichttechnischen Konfidenzbedeutungen, da bei vielen Wiederholungen des Experiments (unabhängig davon, ob sie tatsächlich stattfinden oder nicht) erwartet wird, dass das CI, obwohl es variiert, die meiste Zeit den Parameter enthält.
In diesem umfassenderen, konventionelleren und konstruktiveren Gefühl von "Vertrauen" ist die Antwort auf Frage (5) wahr.