Im Zusammenhang mit der Aufteilung des Entscheidungsbaums ist nicht ersichtlich, warum die Gini-Verunreinigung vorliegt
Im Zusammenhang mit der Aufteilung des Entscheidungsbaums ist nicht ersichtlich, warum die Gini-Verunreinigung vorliegt
Antworten:
Stellen Sie sich ein Experiment mit vor mögliche Ausgabekategorien. Kategorie hat eine Eintrittswahrscheinlichkeit (wo )
Dann reproduzieren Sie die Erfahrung zweimal und machen Sie diese Beobachtungen:
Das ist es! Die Gini-Verunreinigung ist einfach die Wahrscheinlichkeit, zwei verschiedene Ausgaben zu erhalten, was ein "Verunreinigungsmaß" ist. In die andere Richtung, wenn wir eine haben so dass (und damit das andere p (j | t) = 0) haben wir eine Gini-Verunreinigung und wir werden immer zwei identische Ausgaben der Kategorie erhalten , was eine "reine" Situation ist!.
Gini-Verunreinigung = logische Entropie = Gini-Simpson-Biodiversitätsindex = quadratische Entropie mit logischer Distanzfunktion (1-Kroneckerdelta) usw. Siehe: Ellerman, David. 2018. “Logische Entropie: Einführung in die klassische und quantenlogische Informationstheorie.” Entropie 20 (9): Artikel-ID 679. https://doi.org/10.3390/e20090679 und die darin enthaltenen Referenzen.