Kann jemand bitte vorschlagen, was der richtige Schritt ist, um korrelierte Variablen vor dem Feature-Engineering oder nach dem Feature-Engineering zu entfernen?
Ich studiere Datenskalierung und insbesondere die Standardisierungsmethode. Ich habe die Mathematik dahinter verstanden, aber mir ist nicht klar, warum es wichtig ist, den Merkmalen den Mittelwert Null und die Einheitsvarianz zu geben. Kannst du mir erklären ?
Ich habe verstanden, dass die Hauptkomponentenanalyse eine Technik zur Reduzierung der Dimensionalität ist, dh bei 10 Eingabemerkmalen wird eine geringere Anzahl unabhängiger Merkmale erzeugt, die eine orthogonale und lineare Transformation der ursprünglichen Merkmale darstellen. Wird PCAan sich als Lernalgorithmus betrachtet oder ist ein Datenvorverarbeitungsschritt.
Ich muss die Genauigkeit eines Trainingsdatensatzes durch Anwendung des Random Forest-Algorithmus ermitteln. Aber der Typ meines Datensatzes ist sowohl kategorisch als auch numerisch. Beim Versuch, diese Daten anzupassen, wird eine Fehlermeldung angezeigt. 'Eingabe enthält NaN, unendlich oder einen Wert, der für dtype zu groß ist (' float32 ')'. Möglicherweise liegt …
Ich möchte JPG-Dateien überprüfen, wenn sie manipuliert wurden, um den Inhalt zu ändern. Was ich NICHT als Photoshopping betrachte: Zuschneiden Drehen (Skalierung) Bildauflösung Automatische Änderungen, die Smartphones möglicherweise vornehmen Was ich als Photoshopping betrachte: Hinzufügen eines neuen Bildes über Teilen des alten Bildes Ändern des Textes eines Teils eines Bildes …
Ich habe Datensätze, die unter anderem GPS-Koordinaten (Längen- und Breitengrad) enthalten. Ich möchte diese Datensätze verwenden, um Probleme zu untersuchen wie: (1) Berechnen der ETA, um zwischen Start- und Endpunkten zu fahren; und (2) Schätzen des Ausmaßes der Kriminalität für einen bestimmten Punkt. Ich möchte ein lineares Regressionsmodell verwenden. Kann …
ich ein lineares Regressionsmodell mit einer Verlustfunktion durchführe, warum sollte ich anstelle der Regularisierung verwenden?L.1L.1L_1L.2L.2L_2 Ist es besser, eine Überanpassung zu verhindern? Ist es deterministisch (also immer eine einzigartige Lösung)? Ist es besser bei der Auswahl von Features (weil spärliche Modelle hergestellt werden)? Verteilt es die Gewichte auf die Merkmale?
Ist es möglich, mehrere Softmaxe in der letzten Schicht in Keras zu implementieren? Also ist die Summe der Knoten 1-4 = 1; 5-8 = 1; usw. Sollte ich mich für ein anderes Netzwerkdesign entscheiden?
Die meisten Netzwerke, die ich gesehen habe, haben eine oder zwei dichte Schichten vor der endgültigen Softmax-Schicht. Gibt es eine prinzipielle Möglichkeit, die Anzahl und Größe der dichten Schichten zu wählen? Sind zwei dichte Schichten bei gleicher Anzahl von Parametern repräsentativer als eine? Sollte Dropout vor jeder dichten Schicht oder …
Ich lese das Eckpfeiler Sequence to Sequence Learning mit neuronalen Netzen von Ilya Sutskever und Quoc Le. Auf der ersten Seite wird kurz erwähnt, dass: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Kann …
Die Antworten hier haben festgestellt, dass die Dimensionen in t-SNE bedeutungslos sind und dass die Abstände zwischen Punkten kein Maß für die Ähnlichkeit sind . Können wir jedoch etwas über einen Punkt sagen, der auf seinen nächsten Nachbarn im t-SNE-Raum basiert? Diese Antwort darauf , warum Punkte, die genau gleich …
Ich habe einen Datensatz mit 330 Stichproben und 27 Merkmalen für jede Stichprobe mit einem Binärklassenproblem für die logistische Regression. Gemäß der "Regel wenn zehn" benötige ich mindestens 10 Ereignisse für jedes Feature, um eingeschlossen zu werden. Ich habe jedoch einen unausgeglichenen Datensatz mit 20% positiver Klasse und 80% negativer …
Ich habe jetzt ein Buch mit dem Titel "Praktisches maschinelles Lernen mit Scikit-Learn und TensorFlow" gelesen und in Kapitel 11 die folgende Beschreibung zur Erklärung von ELU (Exponential ReLU). Drittens ist die Funktion überall flüssig, auch um z = 0, was den Gradientenabstieg beschleunigt, da sie links und rechts von …
Ich bin ein Anfänger in neuronalen Netzen und erforsche derzeit das word2vec-Modell. Es fällt mir jedoch schwer zu verstehen, was die Feature-Matrix genau ist. Ich kann verstehen, dass die erste Matrix ein One-Hot-Codierungsvektor für ein bestimmtes Wort ist, aber was bedeutet die zweite Matrix? Was bedeutet konkret jeder dieser Werte …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.