Was genau leistet ein nicht parametrischer Test und was machen Sie mit den Ergebnissen?

22

Ich habe das Gefühl, dass dies anderswo gefragt wurde, aber nicht wirklich mit der Art der grundlegenden Beschreibung, die ich brauche. Ich weiß, dass sich nicht parametrische Werte auf den Median stützen und nicht auf den Mittelwert zum Vergleichen ... etwas. Ich glaube auch, dass es auf "Freiheitsgraden" (?) Anstelle von Standardabweichungen beruht. Korrigieren Sie mich, wenn ich mich irre.

Ich habe ziemlich gute Nachforschungen angestellt und versucht, das Konzept zu verstehen, was dahinter steckt, was die Testergebnisse wirklich bedeuten und / oder was ich überhaupt mit den Testergebnissen anfangen soll. niemand scheint sich jedoch jemals in dieses Gebiet zu wagen.

Der Einfachheit halber bleiben wir beim Mann-Whitney-U-Test, von dem ich bemerkt habe, dass er sehr beliebt ist (und der auch scheinbar missbraucht und überbeansprucht wird, um das "quadratische Modell in ein kreisförmiges Loch" zu zwingen). Wenn Sie auch die anderen Tests beschreiben möchten, fühlen Sie sich frei, obwohl ich das Gefühl habe, wenn ich einen verstehe, kann ich die anderen in analoger Weise zu verschiedenen T-Tests usw. verstehen.

Angenommen, ich führe einen nicht parametrischen Test mit meinen Daten durch und erhalte das folgende Ergebnis zurück:

2 Sample Mann-Whitney - Customer Type       

Test Information        
H0: Median Difference = 0       
Ha: Median Difference ≠ 0       

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00 
p-value (2-sided, adjusted for ties):   0.4156

Ich kenne andere Methoden, aber was ist hier anders? Soll der p-Wert kleiner als 0,05 sein? Was bedeutet die "Mann-Whitney-Statistik"? Gibt es eine Verwendung dafür? Überprüfen diese Informationen hier lediglich, ob eine bestimmte Datenquelle, über die ich verfüge, verwendet werden soll oder nicht?

Ich habe einiges an Erfahrung mit Regression und den Grundlagen, bin aber sehr neugierig auf dieses "spezielle" nicht parametrische Zeug - von dem ich weiß, dass es seine eigenen Mängel haben wird.

Stellen Sie sich vor, ich bin ein Fünftklässler und Sie können es mir erklären.

hypothesis-testing nonparametric wilcoxon-mann-whitney

— Taal
quelle

4

Ja, das habe ich schon oft gelesen. Manchmal kann der von Wikipedia verwendete Jargon überwältigend werden, und obwohl er eine genaue Beschreibung hat, muss er nicht unbedingt eine klare Beschreibung für jemanden enthalten, der anfängt, das Gebiet zu erlernen. Ich bin mir nicht sicher, wer das abgelehnt hat, aber ich möchte zu Recht nur eine einfache, klare Erklärung, die fast jeder verstehen kann. Ja, ich habe mich sehr bemüht, einen zu finden, der es glaubt oder nicht. Sie müssen mich nicht sofort abstimmen und mit Wikipedia verlinken. Hat jemand jemals bemerkt, dass einige Lehrer besser sind als andere? Ich suche einen guten "Lehrer" für ein Konzept, an dem ich festhalte.

— Taal

1

Fahren Sie dann mit einem guten nichtparametrischen Statistiktext wie Sprent und Smeeton, Hollander und Wolfe, Conover fort. oder finden Sie einen Einführungstext, der Mann-Whitney enthält.

— Nick Cox

1

Wenn Sie sich Ihre Frage und die andere Frage ansehen, die Sie in letzter Zeit nur über das Internet gestellt haben, funktioniert dies nicht gut für Sie, da Sie offensichtlich sehr verwirrt sind. Deshalb empfehlen @Peter Flom und ich Bücher. Ich habe keine anderen Vorschläge in Reserve. Ich würde auch - aufrichtig und in Ihrem besten Interesse - empfehlen, viel präzisere und weniger gesprächige Fragen zu schreiben. Ihr abschweifender Stil hilft nicht, Ihre Fragen klar zu machen.

— Nick Cox

1

Das Internet alleine funktioniert tatsächlich besser als jedes Buch oder jede Klasse, um ehrlich zu sein - und das gilt für jedes Thema. Ich entschuldige mich für das Schreiben von "gesprächigen" Fragen.

— Taal

3

Nein, es scheint nicht so gut zu funktionieren wie ein gutes Buch. Um Stephen Senn zu paraphrasieren: Es ist merkwürdig, dass die Statistik die einzige Wissenschaft ist, die die Menschen auf den ersten Blick für verständlich halten müssen.

— Frank Harrell

41

Ich weiß, dass sich nicht parametrische Werte auf den Median anstatt auf den Mittelwert stützen

Kaum ein nichtparametrischer Test "verlässt" sich in diesem Sinne auf Mediane. Ich kann nur an ein Paar denken ... und das einzige, von dem Sie wahrscheinlich überhaupt gehört hätten, wäre der Zeichentest.

zu vergleichen ... etwas.

Wenn sie sich auf Mediane verlassen würden, wäre es vermutlich, Mediane zu vergleichen. Aber Tests wie der signierte Rangtest oder der Wilcoxon-Mann-Whitney-Test oder der Kruskal-Wallis-Test sind - trotz der vielen Quellen, die Ihnen dies zu sagen versuchen - überhaupt kein Median-Test. Wenn Sie einige zusätzliche Annahmen treffen, können Sie Wilcoxon-Mann-Whitney und Kruskal-Wallis als Tests von Medianen betrachten, aber unter den gleichen Annahmen (sofern die Verteilungsmittel existieren) können Sie sie auch als Mittelwerttest betrachten .

Die tatsächliche Standortschätzung, die für den Signed Rank-Test relevant ist, ist der Median der paarweisen Durchschnittswerte innerhalb der Stichprobe, derjenige für Wilcoxon-Mann-Whitney (und implizit für das Kruskal-Wallis) ist der Median der paarweisen Unterschiede zwischen den Stichproben .

Ich glaube auch, dass es auf "Freiheitsgraden" beruht? statt Standardabweichung. Korrigieren Sie mich, wenn ich mich irre.

Die meisten nichtparametrischen Tests haben keine "Freiheitsgrade", obwohl sich die Verteilung vieler Tests mit der Stichprobengröße ändert, und Sie könnten dies als Freiheitsgrade in dem Sinne ansehen, dass sich die Tabellen mit der Stichprobengröße ändern. Die Proben behalten natürlich ihre Eigenschaften bei und haben in diesem Sinne keine Freiheitsgrade, aber die Freiheitsgrade bei der Verteilung einer Teststatistik sind normalerweise nicht von Bedeutung. Es kann vorkommen, dass Sie so etwas wie Freiheitsgrade haben - zum Beispiel könnten Sie mit Sicherheit argumentieren, dass das Kruskal-Wallis Freiheitsgrade im Grunde in demselben Sinne hat wie ein Chi-Quadrat, aber es wird normalerweise nicht betrachtet auf diese Weise (zum Beispiel, wenn jemand von den Freiheitsgraden eines Kruskal-Wallis spricht, meint er fast immer den df

Eine gute Diskussion der Freiheitsgrade finden Sie hier /

Ich habe ziemlich gute Nachforschungen angestellt und versucht, das Konzept zu verstehen, was dahinter steckt, was die Testergebnisse wirklich bedeuten und / oder was ich überhaupt mit den Testergebnissen anfangen soll. Jedoch scheint sich niemand jemals in dieses Gebiet zu wagen.

Ich bin mir nicht sicher, was du damit meinst.

Ich könnte einige Bücher vorschlagen, wie Conovers Practical Nonparametric Statistics , und wenn Sie es bekommen können, Neave und Worthingtons Buch ( Distribution-Free Tests ), aber es gibt viele andere - Marascuilo & McSweeney, Hollander & Wolfe oder Daniels Buch zum Beispiel. Ich schlage vor, Sie lesen mindestens 3 oder 4 derjenigen, die am besten zu Ihnen sprechen, vorzugsweise diejenigen, die die Dinge so unterschiedlich wie möglich erklären (dies würde bedeuten, dass Sie mindestens ein wenig von vielleicht 6 oder 7 Büchern lesen, um herauszufinden, ob 3 zu Ihnen passen).

Der Einfachheit halber bleiben wir beim Mann Whitney U-Test, von dem ich bemerkt habe, dass er sehr beliebt ist

Das ist es, was mich an Ihrer Aussage verblüfft hat: "Niemand scheint sich jemals in dieses Gebiet zu wagen." Viele Leute, die diese Tests verwenden, wagen sich in das Gebiet, von dem Sie gesprochen haben.

- und auch scheinbar missbraucht und überbeansprucht

Ich würde sagen, dass nichtparametrische Tests im Allgemeinen nicht ausreichend genutzt werden (einschließlich Wilcoxon-Mann-Whitney) - insbesondere Permutations- / Randomisierungstests, obwohl ich nicht unbedingt bestreiten würde, dass sie häufig missbraucht werden (aber auch parametrische Tests) mehr so).

Angenommen, ich führe einen nicht parametrischen Test mit meinen Daten durch und erhalte das folgende Ergebnis zurück:

[snip]

Ich kenne andere Methoden, aber was ist hier anders?

Welche anderen Methoden meinst du? Womit soll ich das vergleichen?

Bearbeiten: Sie erwähnen die Regression später; Ich gehe dann davon aus, dass Sie mit einem Zwei-Stichproben-T-Test vertraut sind (da es sich wirklich um einen speziellen Regressionsfall handelt).

Unter den Annahmen für den gewöhnlichen t-Test mit zwei Stichproben lautet die Nullhypothese, dass die beiden Populationen identisch sind, entgegen der Alternative, dass sich eine der Verteilungen verschoben hat. Wenn Sie sich die erste der beiden folgenden Hypothesensätze für Wilcoxon-Mann-Whitney ansehen, ist die grundlegende Sache, die dort getestet wird, fast identisch. Der T-Test basiert lediglich auf der Annahme, dass die Stichproben aus identischen Normalverteilungen stammen (abgesehen von einer möglichen Ortsverschiebung). Wenn die Nullhypothese wahr ist und die zugehörigen Annahmen wahr sind, hat die Teststatistik eine t-Verteilung. Wenn die Alternativhypothese wahr ist, nimmt die Teststatistik mit größerer Wahrscheinlichkeit Werte an, die nicht mit der Nullhypothese, sondern mit der Alternative übereinstimmen - wir konzentrieren uns auf die ungewöhnlichsten,

Die Situation ist bei Wilcoxon-Mann-Whitney sehr ähnlich, misst aber die Abweichung von der Null etwas anders. Wenn die Annahmen für den T-Test wahr sind *, ist er fast so gut wie der bestmögliche Test (der T-Test).

* (was in der Praxis nie der Fall ist, obwohl das eigentlich kein so großes Problem ist, wie es sich anhört)

wmw unter null und alternative

In der Tat ist es möglich, den Wilcoxon-Mann-Whitney als einen "t-Test" zu betrachten, der an den Rängen der Daten durchgeführt wird - obwohl es dann keine t-Verteilung gibt; Die Statistik ist eine monotone Funktion einer T-Statistik mit zwei Stichproben, die für die Ränge der Daten berechnet wurde. Sie führt daher zu derselben Reihenfolge ** im Stichprobenraum (dies ist ein "T-Test" für die Ränge - entsprechend durchgeführt - würde die gleichen p-Werte erzeugen wie ein Wilcoxon-Mann-Whitney), so dass genau die gleichen Fälle verworfen werden.

** (strikter Teil der Bestellung, aber lassen wir das beiseite)

[Man könnte meinen, nur die Verwendung der Ränge würde eine Menge Informationen wegwerfen, aber wenn die Daten aus normalen Populationen mit der gleichen Varianz stammen, stimmen fast alle Informationen über die Ortsverschiebung mit den Rangmustern überein. Die tatsächlichen Datenwerte (abhängig von ihren Rängen) fügen dem sehr wenig zusätzliche Informationen hinzu. Wenn Sie schwerer als normal sind, hat der Wilcoxon-Mann-Whitney-Test nach kurzer Zeit eine bessere Leistung und behält sein nominelles Signifikanzniveau bei, sodass "zusätzliche" Informationen über den Rängen nicht nur uninformativ werden, sondern in einigen Fällen Sinn, irreführend. Nahezu symmetrische Schwerfälligkeit ist jedoch eine seltene Situation. Was Sie in der Praxis oft sehen, ist Schiefe.]

Die Grundideen sind sehr ähnlich, die p-Werte haben die gleiche Interpretation (die Wahrscheinlichkeit eines Ergebnisses, oder extremer, wenn die Nullhypothese wahr wäre) - bis hin zur Interpretation einer Ortsverschiebung, wenn Sie dies tun die erforderlichen Annahmen (siehe Diskussion der Hypothesen am Ende dieses Beitrags).

Wenn ich die gleiche Simulation wie in den obigen Darstellungen für den t-Test durchführen würde, würden die Darstellungen sehr ähnlich aussehen - die Skalierung auf der x- und der y-Achse würde unterschiedlich aussehen, aber das grundlegende Erscheinungsbild wäre ähnlich.

Soll der p-Wert kleiner als 0,05 sein?

Sie sollten dort nichts "wollen". Die Idee besteht darin, herauszufinden, ob die Stichproben (in örtlicher Hinsicht) unterschiedlicher sind, als dies durch Zufall erklärt werden kann, und kein bestimmtes Ergebnis zu "wünschen".

Wenn ich sage „Können Sie gehen sehen , was Auto Farbe Raj ist bitte?“, Wenn ich eine unvoreingenommene Einschätzung davon möchte ich Sie nicht wollen , zu gehen „Mann, ich wirklich, wirklich hoffe , es ist blau! Es ist einfach hat zu sein Blau". Am besten, Sie sehen nur, wie die Situation ist, und gehen nicht auf ein „Ich brauche es, um etwas zu sein“ ein.

Wenn Sie ein Signifikanzniveau von 0,05 gewählt haben, lehnen Sie die Nullhypothese ab, wenn der p-Wert unter 0,05 liegt. Es ist jedoch mindestens ebenso interessant, nicht abzulehnen, wenn Sie über eine ausreichend große Stichprobe verfügen, um fast immer relevante Effektgrößen zu erkennen, da darin festgehalten wird, dass vorhandene Unterschiede gering sind.

Was bedeutet die Zahl "mann whitley"?

Die Mann-Whitney- Statistik .

Dies ist im Vergleich zur Werteverteilung nur dann sinnvoll, wenn die Nullhypothese zutrifft (siehe obiges Diagramm). Dies hängt davon ab, welche der verschiedenen Definitionen von einem bestimmten Programm verwendet werden kann.

Gibt es eine Verwendung dafür?

Normalerweise interessiert Sie der genaue Wert nicht, aber wo liegt er in der Nullverteilung (ob er mehr oder weniger typisch für die Werte ist, die Sie sehen sollten, wenn die Nullhypothese wahr ist, oder ob er extremer ist)

$P(X<Y)$

Überprüfen diese Daten hier lediglich, ob eine bestimmte Datenquelle, die ich habe, verwendet werden soll oder nicht?

Dieser Test sagt nichts über "eine bestimmte Datenquelle, die ich haben sollte oder sollte nicht verwendet werden".

Siehe meine Diskussion der beiden Betrachtungsweisen der WMW-Hypothesen unten.

Ich habe einiges an Erfahrung mit Regression und den Grundlagen, bin aber sehr neugierig auf dieses "besondere" nicht parametrische Zeug

Nichtparametrische Tests haben nichts Besonderes (ich würde sagen, die Standardtests sind in vielerlei Hinsicht noch grundlegender als die typischen parametrischen Tests) - vorausgesetzt, Sie verstehen tatsächlich das Testen von Hypothesen.

Das ist jedoch wahrscheinlich ein Thema für eine andere Frage.

Es gibt zwei Hauptmethoden, um den Wilcoxon-Mann-Whitney-Hypothesentest zu betrachten.

i) Man kann sagen: "Ich bin an einer Ortsverschiebung interessiert - das heißt, dass unter der Nullhypothese die beiden Populationen die gleiche (kontinuierliche) Verteilung haben , entgegen der Alternative, dass man relativ zu der" nach oben "oder" nach unten "verschoben ist andere"

Das Wilcoxon-Mann-Whitney funktioniert sehr gut, wenn Sie diese Annahme machen (dass Ihre Alternative nur eine Standortverschiebung ist)

In diesem Fall ist der Wilcoxon-Mann-Whitney-Test tatsächlich ein Test für Mediane ... aber es ist auch ein Test für Mittelwerte oder eine andere ortsäquivariante Statistik (z. B. 90. Perzentile oder getrimmte Mittelwerte oder eine beliebige Anzahl von andere Dinge), da sie alle gleichermaßen von Standortverschiebungen betroffen sind.

Das Schöne daran ist, dass es sehr einfach zu interpretieren ist - und dass es einfach ist, ein Konfidenzintervall für diese Ortsverschiebung zu generieren.

Ortswechsel

Der Wilcoxon-Mann-Whitney-Test reagiert jedoch auf andere Unterschiede als eine Ortsverschiebung.

$\frac{1}{2}$ $\frac{1}{2}$

Verschiebung in P (X <Y) von 1/2

— Glen_b - Setzen Sie Monica wieder ein
quelle

Ich habe die ungefähre Nullverteilung (die in Rot in der neuen obersten Grafik) so gezeichnet, als ob sie stetig wäre ... aber die tatsächliche Verteilung ist diskret. Das Bild ist auf diese Weise weniger überladen.

— Glen_b

3

+1 Gute Antwort. Eine der besten und zugänglichsten Erklärungen für den Wilcoxon-Mann-Whitney-Test, die ich kenne. Vielen Dank.

— COOLSerdash

"In diesem Fall ist das Wilcoxon-Mann-Whitney tatsächlich ein Test für Mediane ... aber es ist auch ein Test für Mittelwerte." Einige Verteilungen haben jedoch keine Mittelwerte, während ihr Median genau definiert ist (z. B. Cauchy).

— Karakal

@caracal Auch wenn dies zutrifft (das habe ich hier schon einige Male dargelegt), gehen die Tester von der Gleichheit der Bevölkerungsmittel aus, vermutlich gehen sie bereits davon aus, dass die Bevölkerungsmittel endlich sind. Wenn nicht, haben sie ein Problem, bevor sie sich für einen Test entscheiden können. Ausgehend von der Annahme, dass es eine Hypothese für gleiche (und damit endliche) Bevölkerungsmittel gibt, ist die WMW unter den gleichen Annahmen, die normalerweise verwendet werden, um einen Test der Mediane (Verschiebungsalternativen) durchzuführen, auch ein Test der Mittel.

— Glen_b

17

Angenommen, Sie und ich trainieren Streckenteams. Unsere Athleten kommen aus der gleichen Schule, haben ein ähnliches Alter und dasselbe Geschlecht (dh sie stammen aus der gleichen Bevölkerung), aber ich behaupte, ein revolutionäres neues Trainingssystem entdeckt zu haben, mit dem meine Teammitglieder viel schneller laufen als deine. Wie kann ich Sie davon überzeugen, dass es wirklich funktioniert?

Wir haben ein Rennen.

Danach setze ich mich und berechne die durchschnittliche Zeit für die Mitglieder meines Teams und die durchschnittliche Zeit für die Mitglieder Ihres Teams. Ich werde den Sieg erringen, wenn die mittlere Zeit für meine Athleten nicht nur schneller als die mittlere für Ihre ist, sondern der Unterschied auch im Vergleich zur "Streuung" oder Standardabweichung unserer Ergebnisse groß ist.

t

$t$

"Aber Matt", beschweren Sie sich, "das ist nicht ganz fair. Unsere Teams sind sich ziemlich ähnlich, aber Sie sind - aufgrund des reinen Zufalls - der schnellste Läufer im Distrikt. Er spielt nicht in der gleichen Liga wie alle anderen." Ansonsten ist er praktisch ein Freak der Natur. Er beendete 3 Minuten vor dem zweitschnellsten Finisher, was Ihre durchschnittliche Zeit erheblich verkürzt, aber der Rest der Konkurrenten ist ziemlich gleichmäßig gemischt. Schauen wir uns stattdessen die Zielreihenfolge an Funktioniert wirklich, die früheren Finalisten sollten größtenteils aus Ihrem Team stammen, aber wenn dies nicht der Fall ist, sollte die Reihenfolge der Finalisten ziemlich zufällig sein. Dies gibt Ihrem Superstar kein übermäßiges Gewicht! "

$t$

$p$

$t$ $t$ $t$

— Matt Krause
quelle

Sie haben meine Frage genau so beantwortet, und ich meine genau so, wie ich wollte, dass sie beantwortet wird. Glen ist auch mehr auf der mathematischen Seite angekommen, und die Kombination dieser beiden Antworten machte den Klick für mich. Ich kann ihm aber die Belohnung nicht wegnehmen - ich meine ... er zeichnet Diagramme, trotz der Klarheit Ihrer Antwort. Ich habe das Gefühl, dass Sie in der Vergangenheit eine Lehrtätigkeit ausgeübt haben. Ich weiß, dass die Antworten hier einige Verallgemeinerungen enthalten können, aber ich wusste, dass ich kein Buch kaufen und es intensiv studieren musste, um anfangen zu können, Nicht-Parametrik auf einer bestimmten Ebene praktisch anzuwenden

— Taal

t

$t$

Das Ironische an all dem ist, dass ich es wahrscheinlich überhaupt nicht benutzen werde. Es hat mich nur gestört, dass ich keine klare Antwort darauf bekommen konnte, was es war. Glen's Antwort ist so viel mehr als ich erwartet und ursprünglich erhalten habe - die besten Antworten, die ich nicht beschreiben kann, da sich jede Beschreibung als unzureichend erweisen würde. Als würde man jemandem sagen, wie die Farbe Blau aussieht. Wenn Sie irgendetwas von Whubers Zeug gelesen haben, klingt es so, als hätten Sie einen ähnlichen Geschmack ...

— Taal

Siehe stats.stackexchange.com/questions/18058/…

— Taal

6

Sie haben um Korrektur gebeten, falls dies falsch ist. Unter dieser Überschrift finden Sie einige Kommentare, die die positiven Vorschläge von @Peter Flom ergänzen.

"Nicht-parametrisch basiert auf dem Median anstelle des Mittelwerts": häufig in der Praxis, aber das ist keine Definition. Einige nicht parametrische Tests (z. B. Chi-Quadrat) haben nichts mit Medianwerten zu tun.
stützt sich auf Freiheitsgrade anstelle von Standardabweichungen; das ist sehr verwirrt. Die Idee der Freiheitsgrade ist in keiner Weise eine Alternative zur Standardabweichung. freiheitsgrade als idee gelten statistisch übergreifend.
"Eine bestimmte Datenquelle, die ich habe, sollte oder sollte nicht verwendet werden": Diese Frage hat nichts mit dem von Ihnen angewendeten Signifikanztest zu tun, bei dem es nur um den Unterschied zwischen Untergruppen von Daten geht und der in Bezug auf den Unterschied zwischen Medianen ausgedrückt wird.

— Nick Cox
quelle

Ich glaube, Ihre Meinung zu mir und die Bitte, "wo falsch" korrigiert zu werden, war die beste Antwort bisher. Ich nehme an, ich brauchte ein paar widerlegte Nullhypothesen, um durch Eliminierung zu lernen. Ihre Antwort hat mir neue Informationen gegeben, die ich verstehe - es gibt noch einige große Lücken in meinem Verständnis des Themas, aber ich kann keine Perfektion erwarten. Vielleicht sind diese Löcher größer als ich ursprünglich erwartet hatte, als ich diese Frage schrieb, und ein Stapelaustausch würde nicht ausreichen, egal wie "gesprächig" ich die Frage gemacht habe.

— Taal

4

Sie "wollen" von einem p-Wert die gleichen Dinge, die Sie in jedem anderen Test wollen.

Die U-Statistik ist das Ergebnis einer Berechnung, genau wie die t-Statistik, die Odds Ratio, die F-Statistik oder was haben Sie. Die Formel kann viele Orte gefunden werden. Es ist nicht sehr intuitiv, aber es gibt auch keine anderen Teststatistiken, bis Sie sich daran gewöhnt haben (wir erkennen bei 2, dass sie im signifikanten Bereich liegen, weil wir sie ständig sehen).

Der Rest der Ausgabe in Ihrem Blocktext sollte klar sein.

Um eine allgemeinere Einführung in nichtparametrische Tests zu erhalten, sage ich @NickCox ... und besorge mir ein gutes Buch. Nicht parametrisch bedeutet einfach "ohne Parameter"; Es gibt viele nicht parametrische Tests und Statistiken für eine Vielzahl von Zwecken.

— Peter Flom - Wiedereinsetzung von Monica
quelle

Ja, im Idealfall würde ein gutes Buch helfen. Bei den heutigen Ressourcen (wie StackExchange), Wikipedia (manchmal), dem Wettbewerb auf dem Youtube-Markt (wussten Sie, dass für jede Million Aufrufe jemand 4000 US-Dollar erhält?) und einer Vielzahl anderer Ressourcen ist dies jedoch unnötig. Generell scheitere ich, genau wie mein Lernstil, auch am einfachen Lernen von Büchern.

— Taal

1

Ich freue mich über Ihren Beitrag, aber er wiederholt tatsächlich bereits das meiste, was ich bereits weiß oder leider angenommen hatte. Es scheint eine Art Muster zu geben, in dem fast jede Erklärung, die ich bekomme, an diesem einen bestimmten Punkt Halt macht. Vielleicht wird es an diesem Punkt zu komplex, um es zu erklären, oder zu viel Aufwand - da bin ich mir nicht sicher. So oder so, es ist ein Muster, das ich von jeder Quelle von Informationen erlebt habe, die ich normalerweise verwende - was ironischerweise die Aussage eines jeden Buches wiederholen würde. Vielleicht wusste ich nicht, dass die Antwort so komplex war; dann habe ich wieder eine heftige antwort auf se gesehen.

— Taal

2

Zuerst bitten Sie uns um Vereinfachung, dann beschweren Sie sich, dass unsere Antworten einfach sind! Wenn Sie die Formel für U (oder etwas anderes) verstehen wollen, schauen Sie sie sich an. Wenn Sie etwas Einfaches wollen, dann fragen Sie nicht nach Komplexität! Der Wikipedia-Eintrag ist ein ausgezeichneter, detaillierter Eintrag mit allen Details. Du verstehst es nicht. So. Was willst du?

— Peter Flom - Wiedereinsetzung von Monica

1

Ich nehme an, irgendwo dazwischen. Zugegeben, ich kann nicht am besten kommunizieren, und ich kann verstehen, dass Sie frustriert sind, heh. Es ist eine Eigenschaft von mir, die mir sehr bewusst ist. Um ehrlich zu sein, muss ich mir überlegen, was ich wirklich will. Es ist fast so, als würde ich versuchen, die Frage so weit zu verschieben, dass sie sich mit einem Bereich überschneidet, den ich nicht kannte oder den ich vorher nicht kannte Über. Es ist schwer, nach etwas zu fragen, das Sie im Allgemeinen nicht verstehen. Ich muss nur darauf zurückkommen, nehme ich an.

— Taal

1

Als Antwort auf eine kürzlich geschlossene Frage wird hier auch das oben Gesagte angesprochen. Nachstehend finden Sie ein Zitat aus Bradleys klassischem " Distribution-Free Statistical Tests" (1968, S. 15–16), das meiner Meinung nach eine ziemlich klare Erklärung darstellt, obwohl es ein bisschen lang ist.

Die Begriffe nichtparametrisch und verteilungsfrei sind kein Synonym, und neitherterm liefert eine völlig zufriedenstellende Beschreibung der Statistikklasse, auf die sie sich beziehen sollen.… Grob gesagt ist ein nichtparametrischer Test eine, die keine Hypothese über den Wert eines Parameters aufstellt in einer statistischen Dichtefunktion, wohingegen ein verteilungsfreier Test keine Annahmen über die genaue Form der Stichprobenpopulation macht. Die Definitionen schließen sich nicht gegenseitig aus, und ein Test kann sowohl verteilungsfrei als auch parametrisch sein. Um völlig klar zu machen, was unter verteilungsfrei zu verstehen ist, müssen drei Verteilungen unterschieden werden: (a) die der Grundgesamtheit; (b) die des tatsächlich von der Prüfung verwendeten Beobachtungsmerkmals; und (c) die der Teststatistik. Die Verteilung, aus der die Tests "frei" sind, ist die von (a), der Stichprobenpopulation. Und die Freiheit, die sie genießen, ist in der Regel relativ.… Die Annahmen sind jedoch nie so ausgeklügelt, dass sie eine Population implizieren, deren Verteilung vollständig spezifiziert ist.… Der Grund… ist sehr einfach: Die Größen werden im [nichtparametrischen] Test nicht als solche verwendet. Es gibt auch kein anderes stark verknüpftes Populationsattribut der Variablen. Stattdessen Es gibt auch kein anderes stark verknüpftes Populationsattribut der Variablen. Stattdessen Es gibt auch kein anderes stark verknüpftes Populationsattribut der Variablen. StattdessenStichprobenkennwerte der erhaltenen Beobachtungen … liefern das von der Teststatistik verwendete Informationsmerkmal.… Während sowohl parametrische als auch nichtparametrische Tests erfordern, dass die Form einer mit Beobachtungen verbundenen Verteilung vollständig bekannt ist, muss dieses Wissen im parametrischen Fall bekannt sein. wird in der Regel nicht erwartet und die erforderliche Größenverteilung aufgrund von ungefähren oder unvollständigen Angaben "angenommen" oder abgeleitet werden. Im nichtparametrischer Fall auf der anderen und die distrbution des Beobachtungs charakteristischenist in der Regel genau aus a priori Überlegungen bekannt und muss daher nicht "vorausgesetzt" werden. Der Unterschied besteht also nicht in der Anforderung, sondern darin, was erforderlich ist, und in der Gewissheit, dass die Anforderung erfüllt wird.

— Avraham
quelle