Data Science

5

Wann korrelierte Variablen entfernt werden sollen

Kann jemand bitte vorschlagen, was der richtige Schritt ist, um korrelierte Variablen vor dem Feature-Engineering oder nach dem Feature-Engineering zu entfernen?

10 machine-learning feature-selection data-science-model

3

Mittelwert Null und Einheitsvarianz

Ich studiere Datenskalierung und insbesondere die Standardisierungsmethode. Ich habe die Mathematik dahinter verstanden, aber mir ist nicht klar, warum es wichtig ist, den Merkmalen den Mittelwert Null und die Einheitsvarianz zu geben. Kannst du mir erklären ?

10 machine-learning feature-scaling normalization

4

Wird PCA als Algorithmus für maschinelles Lernen angesehen?

Ich habe verstanden, dass die Hauptkomponentenanalyse eine Technik zur Reduzierung der Dimensionalität ist, dh bei 10 Eingabemerkmalen wird eine geringere Anzahl unabhängiger Merkmale erzeugt, die eine orthogonale und lineare Transformation der ursprünglichen Merkmale darstellen. Wird PCAan sich als Lernalgorithmus betrachtet oder ist ein Datenvorverarbeitungsschritt.

10 machine-learning pca

2

Wie kann ich kategoriale Datentypen für die zufällige Waldklassifizierung anpassen?

Ich muss die Genauigkeit eines Trainingsdatensatzes durch Anwendung des Random Forest-Algorithmus ermitteln. Aber der Typ meines Datensatzes ist sowohl kategorisch als auch numerisch. Beim Versuch, diese Daten anzupassen, wird eine Fehlermeldung angezeigt. 'Eingabe enthält NaN, unendlich oder einen Wert, der für dtype zu groß ist (' float32 ')'. Möglicherweise liegt …

10 python data-mining random-forest

2

Wie kann ich feststellen, ob ein Bild mit Photoshop versehen wurde?

Ich möchte JPG-Dateien überprüfen, wenn sie manipuliert wurden, um den Inhalt zu ändern. Was ich NICHT als Photoshopping betrachte: Zuschneiden Drehen (Skalierung) Bildauflösung Automatische Änderungen, die Smartphones möglicherweise vornehmen Was ich als Photoshopping betrachte: Hinzufügen eines neuen Bildes über Teilen des alten Bildes Ändern des Textes eines Teils eines Bildes …

10 computer-vision

3

Können GPS-Koordinaten (Längen- und Breitengrad) als Merkmale in einem linearen Modell verwendet werden?

Ich habe Datensätze, die unter anderem GPS-Koordinaten (Längen- und Breitengrad) enthalten. Ich möchte diese Datensätze verwenden, um Probleme zu untersuchen wie: (1) Berechnen der ETA, um zwischen Start- und Endpunkten zu fahren; und (2) Schätzen des Ausmaßes der Kriminalität für einen bestimmten Punkt. Ich möchte ein lineares Regressionsmodell verwenden. Kann …

10 machine-learning feature-selection linear-regression feature-extraction geospatial

2

Warum L1-Regularisierung über L2 verwenden?

ich ein lineares Regressionsmodell mit einer Verlustfunktion durchführe, warum sollte ich anstelle der Regularisierung verwenden?L.1L.1L_1L.2L.2L_2 Ist es besser, eine Überanpassung zu verhindern? Ist es deterministisch (also immer eine einzigartige Lösung)? Ist es besser bei der Auswahl von Features (weil spärliche Modelle hergestellt werden)? Verteilt es die Gewichte auf die Merkmale?

10 linear-regression regularization

2

Keras Multiple "Softmax" in der letzten Schicht möglich?

Ist es möglich, mehrere Softmaxe in der letzten Schicht in Keras zu implementieren? Also ist die Summe der Knoten 1-4 = 1; 5-8 = 1; usw. Sollte ich mich für ein anderes Netzwerkdesign entscheiden?

10 machine-learning keras multiclass-classification

1

Anzahl und Größe der dichten Schichten in einem CNN

Die meisten Netzwerke, die ich gesehen habe, haben eine oder zwei dichte Schichten vor der endgültigen Softmax-Schicht. Gibt es eine prinzipielle Möglichkeit, die Anzahl und Größe der dichten Schichten zu wählen? Sind zwei dichte Schichten bei gleicher Anzahl von Parametern repräsentativer als eine? Sollte Dropout vor jeder dichten Schicht oder …

10 convnet

2

Sortieren Sie Zahlen mit nur 2 versteckten Ebenen

Ich lese das Eckpfeiler Sequence to Sequence Learning mit neuronalen Netzen von Ilya Sutskever und Quoc Le. Auf der ersten Seite wird kurz erwähnt, dass: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Kann …

10 deep-learning

1

Ist der nächste Nachbar mit t-SNE sinnvoll?

Die Antworten hier haben festgestellt, dass die Dimensionen in t-SNE bedeutungslos sind und dass die Abstände zwischen Punkten kein Maß für die Ähnlichkeit sind . Können wir jedoch etwas über einen Punkt sagen, der auf seinen nächsten Nachbarn im t-SNE-Raum basiert? Diese Antwort darauf , warum Punkte, die genau gleich …

10 tsne

2

Wie führe ich eine logistische Regression mit einer großen Anzahl von Funktionen durch?

Ich habe einen Datensatz mit 330 Stichproben und 27 Merkmalen für jede Stichprobe mit einem Binärklassenproblem für die logistische Regression. Gemäß der "Regel wenn zehn" benötige ich mindestens 10 Ereignisse für jedes Feature, um eingeschlossen zu werden. Ich habe jedoch einen unausgeglichenen Datensatz mit 20% positiver Klasse und 80% negativer …

10 machine-learning python predictive-modeling logistic-regression data

4

Warum beschleunigt es den Gradientenabstieg, wenn die Funktion flüssig ist?

Ich habe jetzt ein Buch mit dem Titel "Praktisches maschinelles Lernen mit Scikit-Learn und TensorFlow" gelesen und in Kapitel 11 die folgende Beschreibung zur Erklärung von ELU (Exponential ReLU). Drittens ist die Funktion überall flüssig, auch um z = 0, was den Gradientenabstieg beschleunigt, da sie links und rechts von …

10 deep-learning gradient-descent

3

Suchen Sie die aufeinanderfolgenden Nullen in einem DataFrame und führen Sie eine bedingte Ersetzung durch

Ich habe einen Datensatz wie diesen: Beispieldatenrahmen import pandas as pd df = pd.DataFrame({ 'names': ['A','B','C','D','E','F','G','H','I','J','K','L'], 'col1': [0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0], 'col2': [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0]}) Ich möchte einige der 0's in col1und col2durch …

10 python pandas dataframe

2

Was ist die Feature-Matrix in word2vec?

Ich bin ein Anfänger in neuronalen Netzen und erforsche derzeit das word2vec-Modell. Es fällt mir jedoch schwer zu verstehen, was die Feature-Matrix genau ist. Ich kann verstehen, dass die erste Matrix ein One-Hot-Codierungsvektor für ein bestimmtes Wort ist, aber was bedeutet die zweite Matrix? Was bedeutet konkret jeder dieser Werte …

10 machine-learning neural-network word2vec