Warum verwenden wir einen Gaußschen Kernel als Ähnlichkeitsmetrik?

7

Warum wird beim graphbasierten Clustering der Gaußsche Kernel anstelle des Abstands zwischen zwei Punkten als Ähnlichkeitsmetrik bevorzugt?

— zfb
quelle

1

Ich habe die Idee, dass wir aus Gründen der Ähnlichkeit zwischen 0 und 1 wollen. Der Gaußsche Kern erfüllt dies und das Gewicht wird größer, wenn der Abstand zwischen zwei Punkten größer wird. Gibt es einen anderen Grund?

— zfb

Hier können Sie ein Video sehen, das die Funktion sehr gut erklärt> coursera.org/lecture/machine-learning/…

— Jozani Hosein

8

Seien wir genau. "Distanz" hat in der Datenwissenschaft viele Bedeutungen. Ich denke, Sie sprechen von euklidischer Distanz .

Der Gaußsche Kern ist eine nichtlineare Funktion der euklidischen Distanz.

Die Kernelfunktion nimmt mit der Entfernung ab und liegt zwischen null und eins. In euklidischen Abstand, der Wert steigt mit der Entfernung. Daher ist die Kernelfunktion eine nützlichere Metrik zum Gewichten von Beobachtungen.
Die Tatsache, dass es zwischen Null und Eins liegt, ist eine nette Eigenschaft, während die absolute Entfernung (es kann alles sein) in der euklidischen Entfernung Instabilität und Schwierigkeiten bei der Modellierung verursachen kann.
Der euklidische Abstand (ohne das negative Vorzeichen) ist kein Ähnlichkeitsmaß, sondern eine Abstandsfunktion. Der Gaußsche Kern ist ein Ähnlichkeitsmaß.
Sie können sich den Gaußschen Kern als eine Normalisierungsfunktion für die euklidische Distanz vorstellen.

— Hallo Welt
quelle

1

Ich habe auch eine andere Frage zum σ im Ausdruck. Hat es irgendeine Bedeutung? Meiner Meinung nach könnte dies mit dem Maßstab der Clusterbildung zusammenhängen (z. B. dem Radius einer kreisförmigen Clusterbildung).

— zfb

@zfb Es ist ein Skalierungsparameter. Der Nenner kann wie eine Konstante geschrieben werden.

— HelloWorld

Wie wirkt sich dieser Skalierungsparameter auf den Wert von K (x, x ') oder die Ähnlichkeit aus? Wenn es größer wird, wird K (x, x ') größer. Kann ich sagen, dass die Entfernung kleiner skaliert wird? In diesem Fall handelt es sich um eine Clusterbildung in großem Maßstab (wenn der Cluster beispielsweise durch einen Kreis identifiziert wird) Der Radius des Kreises sollte groß sein, oder mehrere Punkte zusammen werden neu definiert, um aggregierte "Punkte" zu sein, und dann diese aggregierten Punkte zu gruppieren, anstatt einen kleineren zu betrachten.

— zfb

0

Aus der euklidischen Entfernung können Sie viele Ähnlichkeitsmessungen aus Kernfunktionen (Polynom, Exponential, Matern, Brauch ...) ableiten, von denen keine a priori besser oder schlechter ist als der Gaußsche Kern. Es hängt alles von Ihren Daten ab und davon, was Sie erwarten.

Bei einer Kernelfunktion können Sie auch eine beliebige Definition der Entfernung auswählen, die Ihrem Gefühl entspricht: gewichtete euklidische Entfernung, $L^1$ Norm, $L^{\infty}$ Norm, Entfernung des Erdbewegers ...

Nun ist der Gaußsche Kern mit euklidischem Abstand sehr verbreitet, da er sehr intuitiv ist und nützliche Eigenschaften wie Glätte bietet.

— Romain Reboulleau
quelle

0

Im euklidischen Raum, in dem die Achsen durch dargestellt werden $i, j, k$ Vektoren, dreidimensionaler Raum, der Abstand kann durch Verbinden der beiden Punkte und Ermitteln der Länge der Verbindung erhalten werden. Dieser Raum wird immer dann verwendet, wenn die Basis in jeder Richtung unabhängig ist. Mit anderen Worten, wann immer es erforderlich ist, den wahren Abstand zu finden, kann der euklidische Abstand verwendet werden, wenn die Merkmale oder Variablen, tatsächlich Achsen, unabhängig sind. Im Gegenteil, wenn die Variablen korreliert sind, kann der euklidische Abstand nicht verwendet werden, da die Achsen nicht mehr unabhängig sind. In solchen Situationen, die nicht selten sind, kann Mahalanobis verwendet werden. Seine Form ist wie die Gaußsche Distanz.

— Medien
quelle