Es kann keinen einzigen Stand der Technik für die Anpassungsgüte geben (zum Beispiel wird es keinen UMP-Test für allgemeine Alternativen geben, und es kommt wirklich nichts in die Nähe - selbst hoch angesehene Omnibus-Tests haben in manchen Situationen eine schreckliche Leistung).
Im Allgemeinen wählen Sie bei der Auswahl einer Teststatistik die Arten von Abweichungen aus, die am wichtigsten sind, um eine Teststatistik zu erkennen und zu verwenden, die für diesen Job gut ist. Einige Tests eignen sich sehr gut für eine Vielzahl interessanter Alternativen, was sie zu anständigen Standardentscheidungen macht, aber das macht sie nicht zum "Stand der Technik".
Der Anderson Darling ist immer noch sehr beliebt und das aus gutem Grund. Der Cramer-von-Mises-Test wird heutzutage viel weniger verwendet (zu meiner Überraschung, weil er normalerweise besser als der Kolmogorov-Smirnov ist, aber einfacher als der Anderson-Darling - und oft eine bessere Leistung hat als er bei Unterschieden "in der Mitte" von der Vertrieb)
Alle diese Tests leiden unter Voreingenommenheit gegenüber einigen Arten von Alternativen, und es ist leicht, Fälle zu finden, in denen der Anderson-Darling (schrecklich, wirklich) viel schlechter abschneidet als die anderen Tests. (Wie ich vorschlage, sind es mehr "Pferde für Kurse" als ein Test, um sie alle zu regieren). Leider wird diesem Thema oft wenig Beachtung geschenkt (was ist am besten, um die Abweichungen zu erfassen, die für mich am wichtigsten sind?), Leider.
In einigen dieser Beiträge finden Sie möglicherweise einen Wert:
Ist Shapiro-Wilk der beste Normalitätstest? Warum könnte es besser sein als andere Tests wie Anderson-Darling?
2 Stichprobe Kolmogorov-Smirnov vs. Anderson-Darling vs. Cramer-von-Mises (etwa zwei Stichproben, aber viele der Aussagen übertragen sich
Motivation für Kolmogorovs Abstand zwischen Verteilungen (theoretischere Diskussion, aber es gibt mehrere wichtige Punkte zu praktischen Implikationen)
Ich glaube nicht, dass Sie in der Cramer-von-Mises- und Anderson-Darline-Statistik ein Konfidenzintervall für das PDF bilden können, da die Kriterien auf allen Abweichungen und nicht nur auf den größten basieren.