Das Problem bezieht sich auf die Erstellung von Entscheidungsbäumen. Laut Wikipedia sollte ' Gini-Koeffizient ' nicht mit ' Gini-Verunreinigung ' verwechselt werden . Beide Kennzahlen können jedoch beim Erstellen eines Entscheidungsbaums verwendet werden. Diese können unsere Auswahl bei der Aufteilung der Elementmenge unterstützen.
1) 'Gini-Verunreinigung' - Es handelt sich um eine standardmäßige Metrik zur Aufteilung des Entscheidungsbaums (siehe Link oben).
2) 'Gini-Koeffizient' - Jede Aufteilung kann auf der Grundlage des AUC-Kriteriums bewertet werden. Für jedes Aufteilungsszenario können wir eine ROC-Kurve erstellen und die AUC-Metrik berechnen. Laut Wikipedia AUC = (GiniCoeff + 1) / 2;
Die Frage ist: Sind beide Maßnahmen gleichwertig? Einerseits bin ich darüber informiert, dass der Gini-Koeffizient nicht mit der Gini-Verunreinigung verwechselt werden sollte. Auf der anderen Seite können beide Maßnahmen verwendet werden, um dasselbe zu tun - die Qualität eines Entscheidungsbaumsplits zu bewerten.