Interpretation parametrischer und nicht parametrischer Tests

Ich habe Fragen zu parametrischen und nicht parametrischen Testunterscheidungen durchsucht, und es scheint, dass sich alle Fragen auf einen sehr spezifischen Test, ein Datenproblem oder eine technische Unterscheidung konzentrieren. Ich bin nicht an der Frage des Testens von Annahmen (nicht; stattdessen prüfen) oder an der Frage der Leistung oder der Fehlerraten interessiert.

Meine Frage betrifft die Interpretation der beiden Arten von Tests. Gibt es einen Unterschied zwischen der Interpretation des Testergebnisses zwischen parametrisch und nicht parametrisch? Wenn Sie einen nicht parametrischen Test ausführen, schwächen (eliminieren) Sie die Wege zur Diskussion der unbekannten Population, sodass Sie möglicherweise nur eingeschränkter darüber diskutieren können, wie Sie das Testergebnis diskutieren können. Wenn Sie einen parametrischen Test durchführen, hängen Ihre Verbindungen zur Grundgesamtheit von den Annahmen ab. Was sind die richtigen Interpretationen der einzelnen Tests und sind diese Unterscheidungen wichtig?

— John
quelle

Dies ist eine willkommene Gelegenheit, um zu diskutieren und zu klären, was statistische Modelle bedeuten und wie wir darüber denken sollten. Beginnen wir mit Definitionen, damit der Umfang dieser Antwort zweifelsfrei ist, und fahren wir von dort fort. Um diesen Beitrag kurz zu halten, werde ich die Beispiele einschränken und auf alle Abbildungen verzichten, wobei ich darauf vertraue, dass der Leser sie aus Erfahrung liefern kann.

Definitionen

Es scheint möglich, "Test" in einem sehr allgemeinen Sinne so zu verstehen, dass er jede Art von statistischem Verfahren bedeutet: nicht nur einen Nullhypothesentest, sondern auch eine Schätzung, Vorhersage und Entscheidungsfindung in einem häufig vorkommenden oder bayesianischen Rahmen. Dies liegt daran, dass die Unterscheidung zwischen "parametrisch" und "nicht parametrisch" von der Unterscheidung zwischen Arten von Verfahren oder der Unterscheidung zwischen diesen Rahmenbedingungen getrennt ist.

In jedem Fall macht ein Verfahren statistisch, dass es die Welt mit Wahrscheinlichkeitsverteilungen modelliert, deren Eigenschaften nicht vollständig bekannt sind. Ganz abstrakt stellen wir uns Daten wie sie durch numerische Codierung der Werte von Objekten . Die bestimmten Daten, die wir verwenden, entsprechen einem bestimmten . und es gibt ein Wahrscheinlichkeitsgesetz , das irgendwie das bestimmt, das wir tatsächlich haben. $X$ $\omega\in\Omega$ $\omega$ $F$ $\omega$

Es wird angenommen, dass dieses Wahrscheinlichkeitsgesetz zu einer Menge . In einer parametrischen Einstellung entsprechen die Elemente endlichen Sammlungen von Zahlen , den Parametern. In einer nicht parametrischen Einstellung gibt es keine solche Entsprechung. Dies liegt normalerweise daran, dass wir nicht bereit sind, starke Annahmen über zu treffen . $\Theta$ $F\in\Theta$ $\theta(F)$ $F$

Die Natur der Modelle

Es erscheint sinnvoll, eine weitere Unterscheidung zu treffen, die selten diskutiert wird. Unter bestimmten Umständen ist sicher ein vollständig genaues Modell für die Daten. Anstatt zu definieren, was ich unter "vollständig genau" verstehe, möchte ich ein Beispiel geben. Nehmen Sie an einer Untersuchung einer endlichen, genau definierten Population teil, in der die Beobachtungen binär sind, keine fehlen und keine Möglichkeit für Messfehler besteht. Ein Beispiel könnte beispielsweise die zerstörerische Prüfung einer zufälligen Stichprobe von Objekten sein, die vom Fließband kommen. Die Kontrolle, die wir über diese Situation haben - die Kenntnis der Population und die Möglichkeit, die Stichprobe wirklich zufällig auszuwählen - stellt die Richtigkeit eines Binomialmodells für die resultierenden Zählungen sicher. $F$

In vielen - vielleicht den meisten - anderen Fällen ist nicht "vollständig genau". Beispielsweise gehen viele Analysen (entweder implizit oder explizit) davon aus, dass eine Normalverteilung ist. Dies ist physikalisch immer unmöglich, da für jede tatsächliche Messung physikalische Einschränkungen hinsichtlich des möglichen Bereichs gelten, während für Normalverteilungen keine derartigen Einschränkungen gelten. Wir wissen zu Beginn, dass normale Annahmen falsch sind! $\Theta$ $F$

Inwieweit ist ein nicht vollständig genaues Modell ein Problem? Überlegen Sie, was gute Physiker tun. Wenn eine Physikerin die Newtonsche Mechanik verwendet, um ein Problem zu lösen, dann deshalb, weil sie weiß, dass die Newtonsche Mechanik in diesem speziellen Maßstab - diesen Massen, diesen Abständen, diesen Geschwindigkeiten - mehr als genau genug ist, um zu arbeiten. Sie wird sich dafür entscheiden, ihre Analyse zu komplizieren, indem sie Quanten- oder relativistische Effekte (oder beides) nur dann berücksichtigt, wenn das Problem dies erfordert. Sie ist mit Theoremen vertraut, die quantitativ zeigen, wie die Newtonsche Mechanik ein Grenzfall der Quantenmechanik und der speziellen Relativitätstheorie ist. Diese Sätze helfen ihr zu verstehen, welche Theorie sie wählen soll. Diese Auswahl wird normalerweise nicht dokumentiert oder sogar verteidigt. es kann sogar unbewusst auftreten: Die Wahl liegt auf der Hand.

Ein guter Statistiker hat immer vergleichbare Überlegungen im Auge. Wenn sie beispielsweise eine Prozedur auswählt, deren Rechtfertigung auf einer Normalitätsannahme beruht, wägt sie ab, inwieweit das tatsächliche vom normalen Verhalten abweicht und wie sich dies auf die Prozedur auswirken könnte. In vielen Fällen ist der wahrscheinliche Effekt so gering, dass er nicht einmal quantifiziert werden muss: Sie "nimmt Normalität an". In anderen Fällen ist der wahrscheinliche Effekt unbekannt. Unter solchen Umständen wird sie diagnostische Tests durchführen, um die Abweichungen von der Normalität und ihre Auswirkungen auf die Ergebnisse zu bewerten. $F$

Konsequenzen

Es hört sich so an, als ob sich die nicht vollständig genaue Einstellung kaum von der nichtparametrischen unterscheidet: Gibt es wirklich einen Unterschied zwischen der Annahme eines parametrischen Modells und der Bewertung, wie die Realität davon abweicht, einerseits und der Annahme eines nicht parametrischen Modells? auf der anderen Seite? Tief im Inneren sind beide nicht parametrisch.

Lassen Sie uns im Lichte dieser Diskussion die konventionelle Unterscheidung zwischen parametrischen und nicht parametrischen Verfahren überdenken.

"Nichtparametrische Verfahren sind robust." Bis zu einem gewissen Grad müssen also alle Verfahren sein. Das Problem ist nicht die Robustheit gegen nicht-Robustheit, sondern wie robust jedes Verfahren ist. Wie viel und auf welche Weise weicht das wahre von den Verteilungen im angenommenen ? Wie stark sind die Testergebnisse in Abhängigkeit von diesen Abweichungen betroffen? Dies sind grundlegende Fragen, die in jeder Einstellung zutreffen, ob parametrisch oder nicht. $F$ $\Theta$
"Nicht parametrische Verfahren erfordern keine Anpassungstests oder Verteilungstests." Dies ist im Allgemeinen nicht wahr. "Nicht parametrisch" wird oft fälschlicherweise als "verteilungsfrei" charakterisiert, in dem Sinne, dass buchstäblich jede Verteilung sein kann, aber dies ist fast nie der Fall. Fast alle nicht parametrischen Verfahren treffen Annahmen, die einschränken . Zum Beispiel könnte zum Vergleich in zwei Sätze aufgeteilt werden, wobei eine Verteilung einen Satz und eine andere Verteilung den anderen regelt. Möglicherweise wird überhaupt keine Annahme über , aber es wird angenommen, dass eine übersetzte Version von $F$ $\Theta$ $X$ $F_0$ $F_1$ $F_0$ $F_1$ $F_0$ . Das nehmen viele Vergleiche der zentralen Tendenz an. Der Punkt ist , dass es ist eine bestimmte Annahme gemacht , etwa in solchen Tests und es verdient genauso viel geprüft zu werden , wie jede parametrische Annahme sein könnte. $F$
"Nichtparametrische Verfahren machen keine Annahmen." Wir haben gesehen, dass sie es tun. Sie neigen nur dazu, weniger einschränkende Annahmen zu treffen als parametrische Verfahren.

Eine übermäßige Konzentration auf parametrische vs nichtparametrischer könnte ein kontraproduktiver Ansatz. Es übersieht das Hauptziel statistischer Verfahren, nämlich das Verständnis zu verbessern, gute Entscheidungen zu treffen oder geeignete Maßnahmen zu ergreifen. Statistische Verfahren werden basierend darauf ausgewählt, wie gut sie im Problemkontext unter Berücksichtigung aller anderen Informationen und Annahmen über das Problem und im Hinblick auf die Konsequenzen für alle Beteiligten im Ergebnis zu erwarten sind .

Die Antwort auf "Sind diese Unterscheidungen wichtig?" Scheint daher "nicht wirklich" zu sein.

— whuber
quelle