Warum verwenden wir die Kullback-Leibler-Divergenz anstatt die Entropie in der t-SNE-Zielfunktion zu kreuzen?


39

In meinen Augen ist die KL-Abweichung von der Probenverteilung zur wahren Verteilung einfach der Unterschied zwischen Kreuzentropie und Entropie.

Warum verwenden wir die Kreuzentropie als Kostenfunktion in vielen maschinellen Lernmodellen, verwenden aber die Kullback-Leibler-Divergenz in t-sne? Gibt es einen Unterschied in der Lerngeschwindigkeit?


1
Hier finden Sie einige Informationen
kjetil b halvorsen

Antworten:


81

KL-Divergenz ist ein natürlicher Weg, um den Unterschied zwischen zwei Wahrscheinlichkeitsverteilungen zu messen. Die Entropie einer Verteilung p gibt die minimal mögliche Anzahl von Bits pro Nachricht an, die (im Durchschnitt) benötigt würden, um Ereignisse, die aus p gezogen werden, verlustfrei zu codieren . Um diese Grenze zu erreichen, müsste ein optimaler Code für p verwendet werden , der Ereignissen mit höherer Wahrscheinlichkeit kürzere Codewörter zuweist. D K L ( p q ) kann als die erwartete Anzahl zusätzlicher Bits pro Nachricht interpretiert werden, die zum Codieren von Ereignissen erforderlich sind, die aus der wahren Verteilung p gezogen werdenH(p)pppDKL(pq)p, wenn Sie einen optimalen Code für die Verteilung von anstelle von p verwenden . Es hat einige nette Eigenschaften zum Vergleichen von Verteilungen. Wenn beispielsweise p und q gleich sind, ist die KL-Divergenz 0.qppq

H(p,q)pqDKL(pq)H(p,q)pH(p,q)qppH(p,q)p

KL-Divergenz und Kreuzentropie hängen zusammen mit:

DKL(pq)=H(p,q)H(p)

pqp

pq

pH(p)pH(p)p

pqDKL(pq)pqjipji ist die Kullback-Leibler-Divergenz (die in diesem Fall gleich der Querentropie bis zu einer additiven Konstante ist). "

van der Maaten und Hinton (2008) . Visualisierung von Daten mit t-SNE.


Kann ich irgendwie "Lieblings" -Antworten? Ich möchte dieses hier speichern, weil es eine sehr schöne Erklärung ist
zwep

1
Danke, ich bin froh, dass es dir hilft. Sie können eine Frage als Favorit markieren, um den gesamten Thread zu speichern, indem Sie auf das Sternsymbol unter den Abstimmungsschaltflächen klicken. Sie können Ihre Favoritenliste auf Ihrer Kontoseite anzeigen.
user20160
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.