Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten



4
Wird PCA als Algorithmus für maschinelles Lernen angesehen?
Ich habe verstanden, dass die Hauptkomponentenanalyse eine Technik zur Reduzierung der Dimensionalität ist, dh bei 10 Eingabemerkmalen wird eine geringere Anzahl unabhängiger Merkmale erzeugt, die eine orthogonale und lineare Transformation der ursprünglichen Merkmale darstellen. Wird PCAan sich als Lernalgorithmus betrachtet oder ist ein Datenvorverarbeitungsschritt.

2
Wie kann ich kategoriale Datentypen für die zufällige Waldklassifizierung anpassen?
Ich muss die Genauigkeit eines Trainingsdatensatzes durch Anwendung des Random Forest-Algorithmus ermitteln. Aber der Typ meines Datensatzes ist sowohl kategorisch als auch numerisch. Beim Versuch, diese Daten anzupassen, wird eine Fehlermeldung angezeigt. 'Eingabe enthält NaN, unendlich oder einen Wert, der für dtype zu groß ist (' float32 ')'. Möglicherweise liegt …

2
Wie kann ich feststellen, ob ein Bild mit Photoshop versehen wurde?
Ich möchte JPG-Dateien überprüfen, wenn sie manipuliert wurden, um den Inhalt zu ändern. Was ich NICHT als Photoshopping betrachte: Zuschneiden Drehen (Skalierung) Bildauflösung Automatische Änderungen, die Smartphones möglicherweise vornehmen Was ich als Photoshopping betrachte: Hinzufügen eines neuen Bildes über Teilen des alten Bildes Ändern des Textes eines Teils eines Bildes …

3
Können GPS-Koordinaten (Längen- und Breitengrad) als Merkmale in einem linearen Modell verwendet werden?
Ich habe Datensätze, die unter anderem GPS-Koordinaten (Längen- und Breitengrad) enthalten. Ich möchte diese Datensätze verwenden, um Probleme zu untersuchen wie: (1) Berechnen der ETA, um zwischen Start- und Endpunkten zu fahren; und (2) Schätzen des Ausmaßes der Kriminalität für einen bestimmten Punkt. Ich möchte ein lineares Regressionsmodell verwenden. Kann …

2
Warum L1-Regularisierung über L2 verwenden?
ich ein lineares Regressionsmodell mit einer Verlustfunktion durchführe, warum sollte ich anstelle der Regularisierung verwenden?L.1L.1L_1L.2L.2L_2 Ist es besser, eine Überanpassung zu verhindern? Ist es deterministisch (also immer eine einzigartige Lösung)? Ist es besser bei der Auswahl von Features (weil spärliche Modelle hergestellt werden)? Verteilt es die Gewichte auf die Merkmale?


1
Anzahl und Größe der dichten Schichten in einem CNN
Die meisten Netzwerke, die ich gesehen habe, haben eine oder zwei dichte Schichten vor der endgültigen Softmax-Schicht. Gibt es eine prinzipielle Möglichkeit, die Anzahl und Größe der dichten Schichten zu wählen? Sind zwei dichte Schichten bei gleicher Anzahl von Parametern repräsentativer als eine? Sollte Dropout vor jeder dichten Schicht oder …
10 convnet 

2
Sortieren Sie Zahlen mit nur 2 versteckten Ebenen
Ich lese das Eckpfeiler Sequence to Sequence Learning mit neuronalen Netzen von Ilya Sutskever und Quoc Le. Auf der ersten Seite wird kurz erwähnt, dass: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Kann …

1
Ist der nächste Nachbar mit t-SNE sinnvoll?
Die Antworten hier haben festgestellt, dass die Dimensionen in t-SNE bedeutungslos sind und dass die Abstände zwischen Punkten kein Maß für die Ähnlichkeit sind . Können wir jedoch etwas über einen Punkt sagen, der auf seinen nächsten Nachbarn im t-SNE-Raum basiert? Diese Antwort darauf , warum Punkte, die genau gleich …
10 tsne 

2
Wie führe ich eine logistische Regression mit einer großen Anzahl von Funktionen durch?
Ich habe einen Datensatz mit 330 Stichproben und 27 Merkmalen für jede Stichprobe mit einem Binärklassenproblem für die logistische Regression. Gemäß der "Regel wenn zehn" benötige ich mindestens 10 Ereignisse für jedes Feature, um eingeschlossen zu werden. Ich habe jedoch einen unausgeglichenen Datensatz mit 20% positiver Klasse und 80% negativer …



2
Was ist die Feature-Matrix in word2vec?
Ich bin ein Anfänger in neuronalen Netzen und erforsche derzeit das word2vec-Modell. Es fällt mir jedoch schwer zu verstehen, was die Feature-Matrix genau ist. Ich kann verstehen, dass die erste Matrix ein One-Hot-Codierungsvektor für ein bestimmtes Wort ist, aber was bedeutet die zweite Matrix? Was bedeutet konkret jeder dieser Werte …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.