Die Logik der TOST eingesetzt für Wald-Typ t und z Teststatistiken (dh θ/sθ und θ/σθ bezeichnet) kann auf die aufgetragen werden z für nicht - parametrische Tests wie das Zeichen, Zeichen Rang und Rangsummentests Annäherungen. Der Einfachheit halber gehe ich davon aus, dass die Äquivalenz symmetrisch mit einem einzelnen Term ausgedrückt wird, aber die Erweiterung meiner Antwort auf asymmetrische Äquivalenzterme ist unkompliziert.
Ein Problem, das dabei auftritt, ist, dass, wenn man es gewohnt ist, den Äquivalenzterm (z. B. Δ ) in denselben Einheiten wie θ auszudrücken, der Äquivalenzterm in Einheiten des jeweiligen Vorzeichens, des vorzeichenbehafteten Ranges oder Ranges ausgedrückt werden muss Summenstatistik, die sowohl abstrus als auch von N abhängig ist .
Man kann jedoch auch TOST-Äquivalenzterme in Einheiten der Teststatistik selbst ausdrücken. Man bedenke , dass in TOST, wenn z=θ/σθ , dann z1=(Δ−θ)/σθ und z2=(θ+Δ)/σθ . Wenn wir ε=Δ/σθ , dann ist z1=ε−z und z2=z+ε . (Die hier ausgedrückten Statistiken werden beide imrechtenSchwanzausgewertet:p1=P(Z>z1) undp2= P ( Z.> z2) .) Die Verwendung von Einheiten derz-Verteilung zur Definition der Äquivalenz- / Relevanzschwelle kann für nichtparametrische Tests vorzuziehen sein, da die Alternative den Schwellenwert in Einheiten von vorzeichenbehafteten Rängen oder Rangsummen definiert, was für Forscher im Wesentlichen bedeutungslos und schwer zu interpretieren sein kann.
Wenn wir erkennen, dass es (für symmetrische Äquivalenzintervalle) nicht möglich ist, eine TOST-Nullhypothese abzulehnen, wenn ε ≤ z1 - α , können wir entsprechend Entscheidungen über die geeignete Größe des Äquivalenzterms treffen. Zum Beispiel ist ε = z1 - α+ 0,5 .
Dieser Ansatz wurde mit Optionen zur Kontinuitätskorrektur usw. im Paket tost für Stata implementiert (das jetzt spezifische TOST-Implementierungen für die Shapiro-Wilk- und Shapiro-Francia-Tests enthält), auf die Sie zugreifen können, indem Sie Stata eingeben:
Bearbeiten: Warum die Logik von TOST solide ist und Äquivalenztestformationen auf Sammeltests angewendet wurden, hat mich überzeugt, dass meine Lösung auf einem tiefen Missverständnis der ungefähren Statistiken für die Shapiro-Wilk- und Shapiro-Francia-Tests beruhte