Als «multidimensional-scaling» getaggte Fragen

Technik, die beobachtete oder berechnete (Dis-) Ähnlichkeiten zwischen Objekten in Entfernungen in einem niedrigdimensionalen Raum (normalerweise euklidisch) umwandelt. Es konstruiert somit Dimensionen für die Daten; Die Objekte können in diesen Dimensionen geplottet und konzeptualisiert werden


3
Feature-Normalisierung vor oder innerhalb der Modellvalidierung durchführen?
Eine gängige Vorgehensweise beim maschinellen Lernen ist die Merkmalsnormalisierung oder Datenstandardisierung der Prädiktorvariablen. Das ist es, die Daten zu zentrieren, wobei der Mittelwert abgezogen wird, und die Division durch die Varianz (oder auch die Standardabweichung) zu normalisieren. Aus Gründen der Selbstbeherrschung und meines Verständnisses tun wir dies, um zwei Hauptziele …

7
Datennormalisierung und -standardisierung in neuronalen Netzen
Ich versuche, das Ergebnis eines komplexen Systems mithilfe neuronaler Netze (ANNs) vorherzusagen. Die (abhängigen) Ergebniswerte liegen zwischen 0 und 10.000. Die verschiedenen Eingangsvariablen haben unterschiedliche Bereiche. Alle Variablen haben ungefähr normale Verteilungen. Ich betrachte verschiedene Möglichkeiten, um die Daten vor dem Training zu skalieren. Eine Möglichkeit besteht darin, die Eingangsvariablen …

3
ob Indikator / Binär / Dummy-Prädiktoren für LASSO neu skaliert werden sollen
Für das LASSO (und andere Modellauswahlverfahren) ist es entscheidend, die Prädiktoren neu zu skalieren. Die allgemeine Empfehlung, der ich folge, ist einfach, eine Normierung mit 0 Mittelwerten und 1 Standardabweichung für kontinuierliche Variablen zu verwenden. Aber was gibt es mit Dummies zu tun? ZB einige angewandte Beispiele aus derselben (ausgezeichneten) …


5
Gibt es Versionen von t-SNE für das Streaming von Daten?
Mein Verständnis von t-SNE und der Barnes-Hut-Näherung ist, dass alle Datenpunkte erforderlich sind, damit alle Kraftwechselwirkungen gleichzeitig berechnet werden können und jeder Punkt in der 2d-Karte (oder der Karte mit der niedrigeren Dimension) angepasst werden kann. Gibt es Versionen von t-sne, die effizient mit Streaming-Daten umgehen können? Wenn also meine …

3
Welche Rolle spielt MDS in der modernen Statistik?
Ich bin kürzlich auf mehrdimensionale Skalierung gestoßen. Ich versuche, dieses Tool und seine Rolle in der modernen Statistik besser zu verstehen. Hier sind ein paar Leitfragen: Welche Fragen beantwortet es? Welche Forscher sind oft daran interessiert, es zu nutzen? Gibt es andere statistische Techniken, die ähnliche Funktionen ausführen? Welche Theorie …

1
RandomForest - MDS-Plotinterpretation
Ich habe randomForest verwendet, um 6 Verhaltensweisen von Tieren (z. B. Stehen, Gehen, Schwimmen usw.) anhand von 8 Variablen (unterschiedliche Körperhaltungen und Bewegungen) zu klassifizieren. Der MDSplot im randomForest-Paket gibt diese Ausgabe aus und es treten Probleme bei der Interpretation des Ergebnisses auf. Ich habe eine PCA mit den gleichen …

4
PCA nur mit einer Distanzmatrix durchführen
Ich möchte einen massiven Datensatz gruppieren, für den ich nur die paarweisen Abstände habe. Ich habe einen k-medoids-Algorithmus implementiert, dessen Ausführung jedoch zu lange dauert. Daher möchte ich zunächst die Dimension meines Problems durch Anwendung von PCA reduzieren. Die einzige Möglichkeit, diese Methode durchzuführen, ist die Verwendung der Kovarianzmatrix, die …




Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.