Ich vergleiche die Leistung mehrerer Algorithmen für mehrere Datensätze. Da nicht garantiert wird, dass diese Leistungsmessungen normal verteilt sind, habe ich den Friedman-Test mit dem Nemenyi-Post-Hoc-Test basierend auf Demšar (2006) gewählt .
Ich fand dann ein anderes Papier, das nicht nur andere Methoden wie den Quade-Test mit anschließendem Shaffer-Post-hoc-Test vorschlägt, sondern auch den Nemenyi-Test anders anwendet.
Wie wende ich den Nemenyi-Post-Hoc-Test richtig an?
1. Verwenden Sie die Studentized Range-Statistik?
In Demšars Arbeit heißt es, die Nullhypothese (kein Leistungsunterschied zweier Algorithmen) abzulehnen, wenn der durchschnittliche Rangunterschied größer ist als der kritische Abstand CD mit
"wobei kritische Werte qα auf der Statistik des studentisierten Bereichs geteilt durch √ basieren""
Nach einigem Graben habe ich festgestellt, dass Sie diese "kritischen Werte" für bestimmte Alphas nachschlagen können, beispielsweise in einer Tabelle für für unendliche Freiheitsgrade (am Ende jeder Tabelle).
2. oder mit der Normalverteilung?
Gerade als ich dachte, ich wüsste, was zu tun ist, fand ich ein anderes Papier, das mich wieder verwirrte, weil sie nur die Normalverteilung verwendeten. Demšar sagt auf Seite 12 etwas Ähnliches:
In diesem Absatz sprach er über den Vergleich aller Algorithmen mit einem Kontrollalgorithmus, aber die Bemerkung "unterscheiden sich in der Art und Weise, wie sie sich anpassen ... um mehrere Vergleiche zu kompensieren" legt nahe, dass dies auch für den Nemenyi-Test gelten sollte.
Dies führt jedoch zu völlig unterschiedlichen Rangunterschieden, bei denen die Nullhypothese verworfen werden kann. Und jetzt stecke ich fest und weiß nicht, welche Methode ich anwenden soll. Ich neige stark zu dem, der die Normalverteilung verwendet , weil es für mich einfacher und logischer ist. Ich muss auch keine Werte in Tabellen nachschlagen und bin nicht an bestimmte Signifikanzwerte gebunden.
Andererseits habe ich noch nie mit der studentisierten Bereichsstatistik gearbeitet und verstehe sie nicht.