Warum die Namen Typ 1, 2 Fehler?


21

Was ist die Motivation für die Einführung einer zusätzlichen Indirektionsebene von der deskriptiven "falsch-positiven" zur Ganzzahl "1"? Ist 'falsch positiv' wirklich zu lang?


10
Ich bin bei dir, es ist ein schrecklicher Name. Ich nutze jede Gelegenheit, um es nicht zu nutzen.
Matthew Drury

5
Gleich. Ich konnte mich nie daran erinnern, was was war, bis ich diese unglaublich hilfreiche Art hörte, sie auseinander zu halten ... In der Geschichte Der Junge, der Wolf weinte , machen die Dorfbewohner zuerst einen Typ-1- Fehler und das zweite Mal einen Typ-2- Fehler.
Sam

1
@Sam Ich erinnere mich an sie wie in "Das erste, was ein Forscher tut, nachdem er einen Effekt entdeckt hat, ist das Veröffentlichen." Aber auf der rechten Seite gibt es einen Link zu einer Frage mit 84 positiven Stimmen, wie man sich an sie erinnert.
Vorac

Ich finde "falsch positiv" und "falsch negativ" immer sehr verwirrend. In der Medizin bezieht sich "positiv" auf "den Zustand haben" (was bereits verwirrend ist und viele Witze hervorruft), aber welche Art von (statistischem) Test wird verwendet, um festzustellen, ob Sie den Zustand haben? Ist positiv, wenn die Bedingung erfüllt ist, gleich einem zurückgewiesenen Test auf Gesundheit (z. B. Tests auf gesunde Werte einiger Bestandteile, z. B. Eisen im Blut) oder ist es gleich einem nicht zurückgewiesenen Test auf Krankheit (z. B. Tests auf Marker) die auf die Krankheit, den Zustand oder etwas anderes wie eine Schwangerschaft hinweisen)? H0H0
Sextus Empiricus

Antworten:


21

Gute Frage, hat mich zu Google dazu motiviert :) Per Wikipedia (mit geringfügigen Formatierungsänderungen):

Ein Fehler vom Typ I (oder ein Fehler der ersten Art) ist die falsche Zurückweisung einer echten Nullhypothese.

Ein Fehler vom Typ II (oder ein Fehler der zweiten Art) ist das Versagen, eine falsche Nullhypothese abzulehnen.

Weiter unten auf der Seite wird die Etymologie erläutert:

Im Jahr 1928 diskutierten Jerzy Neyman (1894–1981) und Egon Pearson (1895–1980), beide bedeutende Statistiker, die Probleme im Zusammenhang mit der "Entscheidung, ob eine bestimmte Stichprobe als zufällig aus einer bestimmten Population gezogen beurteilt werden kann oder nicht" "...

"... beim Testen von Hypothesen müssen zwei Überlegungen berücksichtigt werden: (1) Wir müssen in der Lage sein, die Wahrscheinlichkeit, eine echte Hypothese abzulehnen, auf einen so niedrigen Wert zu reduzieren, wie es gewünscht wird. (2) Der Test muss so konzipiert sein, dass er es zulässt wird die getestete Hypothese ablehnen, wenn sie wahrscheinlich falsch ist. "

Sie stellten ferner fest , dass bei der Entscheidung , ob abzulehnen zu scheitern, oder lehnt eine bestimmte Hypothese unter einer „Reihe von alternativen Hypothesen“, , . . Es war einfach, einen Fehler zu machen:H1H2

"... [und] diese Fehler werden von zweierlei Art sein:

  • (I) Wir lehnen [dh die zu testende Hypothese] ab, wenn es wahr ist H0
  • (II) Wir können nicht ablehnen, wenn eine alternative Hypothese oder wahr ist. "H0HAH1

    In demselben Aufsatz bezeichnen sie diese beiden Fehlerquellen als Fehler vom Typ I bzw. Fehler vom Typ II.

  • Es sieht also so aus, als ob der erste Fehlertyp auf Fischers ursprünglicher Arbeit über Signifikanztests basiert. Der zweite Fehlertyp beruhte auf der Erweiterung der Arbeit von Fisher durch Neyman und Pearson, nämlich der Einführung der alternativen Hypothese und damit des Hypothesentests. Siehe hier für mehr Details.

    Es scheint, dass die Reihenfolge, in der diese Arten von Fehlern identifiziert wurden, ihrer von Neyman und Pearson angegebenen Anzahl entspricht.


    1
    Historische Gründe - nicht überraschend. Genau wie die Textersetzungsmakros von R <-und C ++. Vielen Dank für die Beantwortung meiner schlecht recherchierten Frage. Und danke an @gung für die nette Frage bearbeiten.
    Vorac

    3
    War "die Reihenfolge, in der sie darüber nachdachten" nicht stark von der vorherigen Arbeit von Fisher beeinflusst? Das heißt, bis Neyman und Pearson die Idee einer alternativen Hypothese einführten, gab es nur einen "Fehlertyp" (der H_0 ablehnte, wenn er wahr ist). Zusammen mit H_A kommt die Möglichkeit eines Fehlers "vom zweiten Typ".
    Steeldriver

    Ich bin mir sicher, dass es das war.
    Ilanman

    Ein kleiner Punkt, der hinzugefügt werden könnte, ist, dass der Artikel "Zur Verwendung und Interpretation bestimmter Testkriterien für statistische Inferenzzwecke" von 1928 die verschiedenen Fehlerquellen noch nicht als "Typ I" - und "Typ II" -Fehler definiert (Stattdessen spricht man von bestelltem Typ, wenn man sich auf Pearson-Distributionen bezieht.) Es ist im Jahr 1933, dass Neyman und Pearson es als Typ I und Typ II definiert.
    Sextus Empiricus

    Es wäre auch gut, das Zitat mit korrekten Referenzen zu begradigen. Oder zumindest das erste Zitat "... beim Testen von Hypothesen zwei Überlegungen ..." stammt nicht wörtlich aus dem Artikel von 1928.
    Sextus Empiricus
    Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
    Licensed under cc by-sa 3.0 with attribution required.