Als «tsne» getaggte Fragen

T-Distributed Stochastic Neighbor Embedding (t-SNE) ist ein nichtlinearer Algorithmus zur Reduzierung der Dimensionalität, der 2008 von van der Maaten und Hinton eingeführt wurde.



1
Was bedeutet PCA, wenn nur große paarweise Abstände beibehalten werden?
Ich lese gerade über die t-SNE-Visualisierungstechnik und es wurde erwähnt, dass einer der Nachteile der Verwendung der Hauptkomponentenanalyse (PCA) zur Visualisierung hochdimensionaler Daten darin besteht, dass nur große paarweise Abstände zwischen den Punkten beibehalten werden. Bedeutungspunkte, die im hochdimensionalen Raum weit voneinander entfernt sind, würden auch im niedrigdimensionalen Unterraum weit …

1
t-SNE mit gemischten kontinuierlichen und binären Variablen
Ich untersuche derzeit die Visualisierung hochdimensionaler Daten mit t-SNE. Ich habe einige Daten mit gemischten binären und kontinuierlichen Variablen und die Daten scheinen die binären Daten viel zu leicht zu gruppieren. Dies wird natürlich für skalierte Daten (zwischen 0 und 1) erwartet: Der euklidische Abstand ist zwischen binären Variablen immer …



1
Wie heißt die Verteilungsfamilie mit PDF proportional zu ?
Betrachten Sie eine Familie von Verteilungen mit PDF (bis zu einer Proportionalitätskonstante), die durch Wie heißt es? Wenn es keinen Namen hat, wie würden Sie es nennen?p(x)∼1(1+αx2)1/α.p(x)∼1(1+αx2)1/α.p(x)\sim \frac{1}{(1+\alpha x^2)^{1/\alpha}}. Es sieht der Familie der Verteilungen mit PDF, das proportional zu ziemlich ähnlichp ( x ) ≤ 1tttp(x)∼1(1+1νx2)(ν+1)/2.p(x)∼1(1+1νx2)(ν+1)/2.p(x)\sim \frac{1}{(1+\frac{1}{\nu} x^2)^{(\nu+1)/2}}. Wenn …

1
Intuition zur t-SNE-Visualisierungstechnik
Ich erzeugte eine t-SNE-Visualisierung eines Datensatzes (ungefähr 10 standardisierte (Mittelwert = 0, sd = 1) numerische Merkmale) und kam zu einem folgenden zweidimensionalen Diagramm. Ich habe keine gute Vorstellung davon, warum die Punkte in bogenförmigen Gruppen ausgerichtet sind, siehe zum Beispiel den rechten unteren Teil des beigefügten Bildes (oder den …

2
Warum werden bei der Implementierung von t-SNE in R standardmäßig Duplikate entfernt?
Insbesondere hat die R-Implementierung von t-SNE im Rtsne-Paket das Argument "check_duplicates", und die Dokumentation schlägt vor, dass "es am besten ist, sicherzustellen, dass keine Duplikate vorhanden sind, und diese Option auf FALSE zu setzen, insbesondere für große Datenmengen". Wenn Sie versuchen, t-SNE für ein Dataset in R auszuführen, das Duplikate …
7 tsne 
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.