Wie wählt man ein Konfidenzniveau?

Ich verwende oft ein Konfidenzniveau von 90%, wobei ich akzeptiere, dass dies einen höheren Unsicherheitsgrad als 95% oder 99% aufweist.

Aber gibt es Richtlinien zur Auswahl des richtigen Konfidenzniveaus? Oder Richtlinien für die in verschiedenen Bereichen verwendeten Konfidenzniveaus?

Gibt es beim Interpretieren und Präsentieren von Vertrauensstufen auch Anleitungen, um die Zahl in Sprache umzuwandeln? Zum Beispiel solche Anleitungen für Pearson's r ( edit: diese Beschreibungen sind für die Sozialwissenschaften):

http://faculty.quinnipiac.edu/libarts/polsci/Statistics.html

Aktualisieren

Vielen Dank für die Antworten unten. Sie waren alle sehr hilfsbereit, aufschlussreich und lehrreich.

Im Folgenden finden Sie einige nützliche Artikel zur Auswahl des Signifikanzniveaus (im Wesentlichen dieselbe Frage), auf die ich bei der Untersuchung dieser Frage gestoßen bin. Sie bestätigen, was in den Antworten unten gesagt wird.

"Was bedeutet 0.05?"

http://www.p-value.info/2013/01/whats-significance-of-005-significance_6.html

"Über die Ursprünge des Niveaus der statistischen Signifikanz von 0,05"

http://www.radford.edu/~jaspelme/611/Spring-2007/Cowles-n-Davis_Am-Psyc_orignis-of-05-level.pdf

"Wissenschaftliche Methode: Statistische Fehler"

http://www.nature.com/news/scientific-method-statistical-errors-1.14700

— Oliver Moran
quelle

Antworten:

Neben Tims großartiger Antwort gibt es sogar innerhalb eines Feldes verschiedene Gründe für bestimmte Konfidenzintervalle. In einer klinischen Studie für Haarspray möchten Sie zum Beispiel sehr sicher sein, dass Ihre Behandlung wahrscheinlich niemanden umbringt, sagen wir 99,99%, aber mit einem 75% -Konfidenzintervall, in dem Ihr Haarspray die Haare zum Bleiben bringt, wäre alles in Ordnung Gerade.

Im Allgemeinen sollten Konfidenzintervalle so verwendet werden, dass Sie mit der Unsicherheit einverstanden sind, aber auch nicht so streng, dass sie die Aussagekraft Ihrer Studie in den Hintergrund rücken. Ein 90% -Konfidenzintervall bedeutet, dass bei Wiederholung der Stichprobe zu erwarten ist, dass jede zehnte Generierung nicht den wahren Wert enthält. Ist das akzeptabel, basierend auf dem, was Sie recherchieren? Wenn Sie dagegen ein Konfidenzintervall von 99% bevorzugen, ist Ihre Stichprobengröße ausreichend, damit Ihr Intervall nicht unnötig groß wird? (Hoffentlich entscheiden Sie das CI-Level, bevor Sie die Studie durchführen, oder?)

Nach meiner Erfahrung (in den Sozialwissenschaften) und nach dem, was ich von meiner Frau (in den Biowissenschaften) gesehen habe, gibt es zwar CI / Signifikanz-Standards in verschiedenen Bereichen und in verschiedenen Sonderfällen, aber das ist nicht ungewöhnlich Bei den meisten Debatten über ein Thema geht es darum, ob Sie Ihr CI-Intervall oder Ihr Signifikanzniveau angemessen festlegen. Ich war in Besprechungen, in denen ein Statistiker einem Kunden geduldig erklärte, dass die Daten zwar ein zweiseitiges Konfidenzintervall von 99% bevorzugen, dass sie jedoch ihre Stichprobe verzehnfachen müssten, um jemals eine Signifikanz zu erhalten. und ich war in Besprechungen, in denen Kunden gefragt wurden, warum keine ihrer Daten einen signifikanten Unterschied aufweist, und wir ihnen geduldig erklären, dass sie ein hohes Intervall gewählt haben - oder umgekehrt, alles ist signifikant, weil ein niedrigeres Intervall angefordert wurde.

Was ich vorschlage, ist, einige der wichtigsten Artikel in Ihrem Fach zu lesen (so nah wie möglich an Ihrem spezifischen Thema) und zu sehen, was sie verwenden. Kombinieren Sie dies mit Ihrem Komfortniveau und Ihrer Stichprobengröße. und seien Sie dann bereit zu verteidigen, was Sie mit diesen Informationen zur Hand wählen. Wenn Sie sich nicht in einem Bereich mit sehr strengen Regeln befinden - klinische Studien, von denen ich vermute, dass sie die einzigen sind, die wirklich so streng sind, zumindest was ich gesehen habe -, werden Sie nichts Besseres bekommen. (Und wenn es strenge Regeln gibt, würde ich erwarten, dass die wichtigsten Zeitungen auf Ihrem Gebiet diesen folgen!)

— Joe
quelle

α

$\alpha$

@ Alexis Leider vergisst einer von ihnen bei ein paar Tausend Benutzern wahrscheinlich, niemals ein Feuerzeug zu benutzen, während er sich die Haare sprüht ...

— Joe

"Ein Konfidenzintervall von 90% bedeutet, dass Sie einmal in zehn Fällen einen Ausreißer finden." Dies ist ausgesprochen falsch, es sei denn, ich

— verstehe

90% CI bedeutet, dass der Mittelwert der Grundgesamtheit zu 90% innerhalb des Konfidenzintervalls und zu 10% außerhalb (auf der einen oder anderen Seite) des Intervalls liegt. 1 Mal von 10 enthält Ihr Ergebnis also nicht den wahren Mittelwert. Vielleicht ist "Ausreißer" das falsche Wort (obwohl CIs häufig (falsch) für diesen Zweck verwendet werden.)

— Joe

@ Joe, mir ist klar, dass dies ein alter Kommentarbereich ist, aber das ist falsch. Sie können ein CI von jedem Grad an "Vertrauen" haben, das niemals den wahren Wert enthält. Siehe hier: stats.stackexchange.com/a/26457/176202

— Frans Rodenburg

Die Auswahl eines Konfidenzintervallbereichs ist eine subjektive Entscheidung. Sie können buchstäblich jedes Konfidenzintervall auswählen: 50%, 90%, 99,999% ... usw. Es geht darum, wie viel Vertrauen Sie haben möchten. Wahrscheinlich sind 95% CI die am häufigsten verwendeten.

Was die Interpretation und den von Ihnen angegebenen Link betrifft ... Diese Interpretationsarten sind zu einfach . Die Korrelation ist ein gutes Beispiel, da in verschiedenen Kontexten unterschiedliche Werte als "starke" oder "schwache" Korrelation angesehen werden können. Schauen Sie sich ein zufälliges Beispiel aus dem Internet an :

Ich habe einmal eine Chemikerin gefragt, die ein Laborinstrument auf einen Standard kalibriert, nach welchem Wert der Korrelationskoeffizient sie gesucht hat. „0,9 ist zu niedrig. Du brauchst mindestens 0,98 oder 0,99. “Sie erhielt die Nummer aus einem Regierungsdokument.

Ich fragte einmal einen Ingenieur, der eine Regressionsanalyse eines Behandlungsprozesses durchführte, nach welchem Wert des Korrelationskoeffizienten er suchte. "Alles zwischen 0,6 und 0,8 ist akzeptabel." Sein College-Professor sagte ihm dies.

Ich fragte einmal einen Biologen, der eine ANOVA von der Größe von Feldmäusen durchführte, die in kontaminierten versus unberührten Böden lebten, nach welchem Wert der Korrelationskoeffizient, den er suchte. Er wusste es nicht, aber sein Cutoff betrug 0,2, basierend auf dem kleinsten Größenunterschied, den sein Modell mit der Anzahl seiner Proben feststellen konnte.

Tut mir leid, aber es gibt keine Abkürzungen ...

Um ein besseres Gefühl für die Konfidenzintervalle zu bekommen, können Sie hier , hier oder hier mehr darüber lesen .

— Tim
quelle

Nettes Zitat. +1.

— Amöbe sagt Reinstate Monica

Was Sie über Korrelationsbeschreibungen sagen, ist richtig. Es ist völlig feldbezogen. Die Beschreibungen im Link gelten für die Sozialwissenschaften. Ich nehme an, eine Beschreibung für das Konfidenzintervall wäre auch feldabhängig.

— Oliver Moran

Obwohl das Konfidenzniveau im Allgemeinen im Ermessen des Analysten liegt, gibt es Fälle, in denen sie durch Gesetze und Vorschriften festgelegt werden. Ich gebe Ihnen zwei Beispiele.

Bei der Bankenaufsicht müssen Sie bei der Berechnung bestimmter Risiken ein Konfidenzniveau von 99% verwenden (siehe Seite 2 in dieser Basler Verordnung) .

Die FDA kann anweisen, bestimmte Vertrauensniveaus für Arzneimittel- und Produkttests in ihren statistischen Methoden zu verwenden.

Insgesamt ist es eine gute Praxis, den Experten auf Ihrem Gebiet zu konsultieren, um herauszufinden, welche Praktiken und Vorschriften hinsichtlich des Vertrauensniveaus akzeptiert werden.

— Aksakal
quelle