Gibt es statistische Tests, die parametrisch und nicht parametrisch sind? Diese Frage wurde von einem Interviewpanel gestellt. Ist es eine gültige Frage?
Gibt es statistische Tests, die parametrisch und nicht parametrisch sind? Diese Frage wurde von einem Interviewpanel gestellt. Ist es eine gültige Frage?
Antworten:
Es ist grundsätzlich schwierig, genau zu sagen, was unter einem "parametrischen Test" und einem "nicht parametrischen Test" zu verstehen ist, obwohl es viele konkrete Beispiele gibt, bei denen sich die meisten darüber einig sind, ob ein Test parametrisch oder nicht parametrisch ist (aber niemals beides). . Eine schnelle Suche ergab diese Tabelle , die meines Erachtens in einigen Bereichen eine allgemeine praktische Unterscheidung zwischen parametrischen und nicht parametrischen Tests darstellt.
Direkt über der Tabelle, auf die verwiesen wird, befindet sich eine Bemerkung:
"... parametrische Daten haben eine zugrunde liegende Normalverteilung .... Alles andere ist nicht parametrisch."
In einigen Bereichen kann es ein akzeptiertes Kriterium sein, dass wir entweder Normalität annehmen und ANOVA verwenden, und dies ist parametrisch, oder wir gehen nicht von Normalität aus und verwenden nicht-parametrische Alternativen.
Es ist vielleicht keine sehr gute Definition und meiner Meinung nach nicht richtig, aber es kann eine praktische Faustregel sein. Meistens, weil das Endziel in den Sozialwissenschaften darin besteht, Daten zu analysieren, und was nützt es, ein parametrisches Modell auf der Grundlage einer nicht normalen Verteilung zu formulieren und dann die Daten nicht analysieren zu können?
Eine alternative Definition besteht darin, "nicht parametrische Tests" als Tests zu definieren, die nicht auf Verteilungsannahmen und parametrischen Tests beruhen.
Die vorgestellte erstere sowie die letztere Definition definieren eine Testklasse und dann die andere Klasse als Komplement (alles andere). Per Definition schließt dies aus, dass ein Test sowohl parametrisch als auch nicht parametrisch sein kann.
Die Wahrheit ist, dass auch die letztere Definition problematisch ist. Was ist, wenn bestimmte natürliche "nicht parametrische" Annahmen wie Symmetrie auferlegt werden können? Verwandelt sich eine Teststatistik, die ansonsten nicht auf Verteilungsannahmen beruht, in einen parametrischen Test? Die meisten würden nein sagen!
Daher gibt es Tests in der Klasse der nichtparametrischen Tests, die einige Verteilungsannahmen treffen dürfen solange sie nicht "zu parametrisch" sind. Die Grenze zwischen den "parametrischen" und den "nicht parametrischen" Tests ist verschwommen, aber ich glaube, dass die meisten der Ansicht sind, dass ein Test entweder parametrisch oder nicht parametrisch ist macht wenig Sinn.
Unter einem anderen Gesichtspunkt sind viele parametrische Tests (äquivalent zu) Likelihood-Ratio-Tests. Dies ermöglicht eine allgemeine Theorie, und wir haben ein einheitliches Verständnis der Verteilungseigenschaften von Likelihood-Ratio-Tests unter geeigneten Regularitätsbedingungen. Nichtparametrische Tests sind im Gegensatz dazu nicht gleichbedeutend mit Likelihood-Ratio-Tests an sich es gibt keine Wahrscheinlichkeit - und ohne die einheitliche Methodik, die auf der Wahrscheinlichkeit basiert, müssen wir Verteilungsergebnisse von Fall zu Fall ableiten. Die Theorie der empirischen WahrscheinlichkeitDer hauptsächlich von Art Owen in Stanford entwickelte Kompromiss ist jedoch sehr interessant. Es bietet einen wahrscheinlichkeitsbasierten Ansatz für die Statistik (ein wichtiger Punkt für mich, da ich die Wahrscheinlichkeit als wichtigeres Objekt betrachte als etwa einen Wert ), ohne dass typische parametrische Verteilungsannahmen erforderlich sind. Die Grundidee ist eine geschickte Verwendung der Multinomialverteilung auf den empirischen Daten. Die Methoden sind sehr "parametrisch", aber gültig, ohne die parametrischen Annahmen einzuschränken.
Tests, die auf der empirischen Wahrscheinlichkeit basieren, haben meiner Meinung nach die Vorzüge parametrischer Tests und die Allgemeingültigkeit nichtparametrischer Tests. Von den Tests, die mir in den Sinn kommen, kommen sie meiner Meinung nach am ehesten in Frage, sowohl parametrisch als auch nichtparametrisch zu sein Verwenden Sie diese Terminologie nicht.
Parametrisch wird in (mindestens) zwei Bedeutungen verwendet: A - Um zu erklären, dass Sie die Familie der Rauschverteilung bis zu ihren Parametern annehmen. B - Zur Erklärung nehmen Sie die spezifische funktionale Beziehung zwischen den erklärenden Variablen und dem Ergebnis an.
Einige Beispiele:
Der Begriff "semiparametrisch" bezieht sich normalerweise auf Fall B und bedeutet, dass Sie nicht die gesamte Funktionsbeziehung annehmen, sondern mildere Annahmen wie "Additiv bei einer gewissen reibungslosen Transformation der Prädiktoren".
Sie können auch mildere Annahmen über die Verteilung des Rauschens treffen, z. B. "Alle Momente sind endlich", ohne die Form der Verteilung speziell festzulegen. Für diese Art von Annahme gibt es meines Wissens keinen Begriff.
Beachten Sie, dass sich die Antwort auf die zugrunde liegenden Annahmen bezieht, die dem Datenerzeugungsprozess zugrunde liegen. Wenn man "a-parametrischer Test" sagt, bezieht man sich normalerweise auf "nicht-parametrisch" im Sinne A. In diesem Sinne würde ich mit "nein" antworten. Es wäre unmöglich, gleichzeitig parametrisch und nicht parametrisch im gleichen Sinne zu sein.
Ich nehme an, das hängt davon ab, was sie mit "parametrisch und nicht parametrisch" meinen. Zur gleichen Zeit genau beides, oder eine Mischung aus beidem?
Viele halten das proportionale Cox-Gefährdungsmodell für semi-parametrisch, da es die Grundgefahr nicht parametrisch abschätzt.
Oder Sie können viele nicht parametrische Statistiken als massiv parametrisch anzeigen.
Bradley verdeutlicht in seinen klassischen verteilungsfreien statistischen Tests (1968, S. 15–16 - siehe diese Frage für ein Zitat) den Unterschied zwischen verteilungsfreien und nichtparametrischen Tests, von denen er sagt, dass sie oft miteinander in Konflikt stehen, und gibt eine Beispiel eines Tests ohne Parameterverteilung als Vorzeichentest für den Median. Dieser Test geht nicht von der zugrunde liegenden Verteilung der Grundgesamtheit variabler Werte aus und ist daher verteilungsfrei . Wenn der ausgewählte Median jedoch korrekt ist, sollten Werte darüber und darunter mit gleicher Wahrscheinlichkeit ausgewählt werden, wobei Stichproben aus getestet werden
Aktualisieren