Ich habe kürzlich einen Datensatz ( Link ) mit 369 Klassen veröffentlicht. Ich habe ein paar Experimente mit ihnen durchgeführt, um ein Gefühl dafür zu bekommen, wie schwierig die Klassifizierungsaufgabe ist. Normalerweise gefällt es mir, wenn es Verwirrungsmatrizen gibt, um zu sehen, welche Art von Fehler gemacht wird. Eine Matrix ist jedoch nicht praktikabel.
Gibt es eine Möglichkeit, wichtige Informationen zu großen Verwirrungsmatrizen zu geben? Zum Beispiel gibt es normalerweise viele Nullen, die nicht so interessant sind. Ist es möglich, die Klassen so zu sortieren, dass die meisten Einträge ungleich Null um die Diagonale liegen, um die Anzeige mehrerer Matrizen zu ermöglichen, die Teil der vollständigen Verwirrungsmatrix sind?
Hier ist ein Beispiel für eine große Verwirrungsmatrix .
Beispiele in freier Wildbahn
Abbildung 6 von EMNIST sieht gut aus:
Es ist leicht zu erkennen, wo sich viele Fälle befinden. Dies sind jedoch nur Klassen. Wenn die gesamte Seite anstelle nur einer Spalte verwendet würde, könnte dies wahrscheinlich dreimal so viele sein, aber das wären immer noch nur 3 ⋅ 26 = 78 Klassen. Nicht einmal in der Nähe von 369 Klassen von HASY oder 1000 von ImageNet.
Siehe auch
Meine ähnliche Frage zu CS.stackexchange