Die Tests, die Verteilungen vergleichen, sind Ausschlusstests. Sie beginnen mit der Nullhypothese, dass die beiden Populationen identisch sind, und versuchen dann, diese Hypothese abzulehnen. Wir können niemals beweisen, dass die Null wahr ist, lehnen sie einfach ab, sodass diese Tests nicht wirklich dazu dienen können, zu zeigen, dass zwei Proben aus derselben Population (oder aus identischen Populationen) stammen.
Dies liegt daran, dass es geringfügige Unterschiede in den Verteilungen geben kann (was bedeutet, dass sie nicht identisch sind), diese jedoch so klein sind, dass Tests den Unterschied nicht wirklich feststellen können.
Betrachten Sie 2 Verteilungen, die erste ist einheitlich von 0 bis 1, die zweite ist eine Mischung aus 2 Uniformen, also 1 zwischen 0 und 0,999 und 1 zwischen 9,999 und 10 (0 an anderer Stelle). Es ist also klar, dass diese Verteilungen unterschiedlich sind (ob der Unterschied bedeutsam ist, ist eine andere Frage). Wenn Sie jedoch eine Stichprobengröße von 50 (insgesamt 100) wählen, besteht eine Wahrscheinlichkeit von über 90%, dass Sie nur Werte zwischen 0 und 0,999 und sehen kann keinen wirklichen Unterschied erkennen.
Es gibt Möglichkeiten, so genannte Äquivalenztests durchzuführen, bei denen Sie fragen, ob die 2 Verteilungen / Populationen äquivalent sind. Sie müssen jedoch definieren, was Sie als äquivalent betrachten. In der Regel liegt ein Differenzmaß innerhalb eines bestimmten Bereichs, dh die Differenz der 2 Mittelwerte beträgt weniger als 5% des Durchschnitts der 2 Mittelwerte, oder die KS-Statistik liegt unter einem bestimmten Grenzwert usw. Wenn Sie kann dann ein Konfidenzintervall für die Differenzstatistik berechnen (Mittelwertdifferenz kann nur das Konfidenzintervall sein, Bootstrapping, Simulation oder andere Methoden können für andere Statistiken erforderlich sein). Wenn das gesamte Konfidenzintervall in den "Äquivalenzbereich" fällt, betrachten wir die 2 Populationen / Verteilungen als "äquivalent".
Der schwierige Teil besteht darin, herauszufinden, wie die Äquivalenzregion aussehen soll.