Ich habe kürzlich über einen alternativen Weg des "Äquivalenztests" nachgedacht, der auf einem Abstand zwischen den beiden Verteilungen und nicht zwischen ihren Mitteln basiert .
Es gibt einige Methoden, die Konfidenzintervalle für die Überlappung von zwei Gaußschen Verteilungen bereitstellen :
Die Überlappung von (zwischen?) Zwei Verteilungen und hat eine schöne probabilistische Interpretation:
wobeiist der Gesamtabstand zwischen und .O(P1,P2)P1P2
1−O(P1,P2)=TV(P1,P2)
TV(P1,P2)=supA∣∣P1(A)−P2(A)∣∣P1P2
Das heißt, wenn beispielsweise dann unterscheiden sich die Wahrscheinlichkeiten, die durch und eines Ereignisses gegeben sind, nicht mehr als . Grob gesagt ergeben die beiden Verteilungen die gleichen Vorhersagen von bis zu .O(P1,P2)>0.9P1P20.110%
Anstatt also ein Akzeptanzkriterium zu verwenden, das auf einem kritischen Wert für die Differenz zwischen den Mittelwerten und basiert , wie bei der klassischen Äquivalenzprüfung, könnten wir es auf einen kritischen Wert für die Differenz zwischen den Wahrscheinlichkeiten der Vorhersagen von stützen die zwei Distributionen.μ1μ2
Ich denke, es gibt einen Vorteil in Bezug auf die "Objektivität" des Kriteriums. Der kritische Wert vonsollte von einem Experten für das eigentliche Problem angegeben werden: Dies sollte ein Wert sein, ab dem der Unterschied eine praktische Bedeutung hat. Aber manchmal hat niemand ein solides Wissen über das eigentliche Problem und es gibt keinen Experten, der einen kritischen Wert liefern kann. Das Annehmen eines herkömmlichen kritischen Wertes für das könnte ein Weg zu einem Kriterium sein, das nicht von dem betrachteten physikalischen Problem abhängt.|μ1−μ2|TV(P1,P2)
Im Gaußschen Fall mit gleichen Varianzen ist die Überlappung eins zu eins bezogen auf die standardisierte mittlere Differenz .|μ1−μ2|σ