Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten


3
Fuzzy-Name und Spitzname stimmen überein
Ich habe einen Datensatz mit folgender Struktur: full_name,nickname,match Christian Douglas,Chris,1, Jhon Stevens,Charlie,0, David Jr Simpson,Junior,1 Anastasia Williams,Stacie,1 Lara Williams,Ana,0 John Williams,Willy,1 Dabei ist jede Prädiktorzeile ein Paar, vollständiger Name, Spitzname und Zielvariable, Übereinstimmung. Dies ist 1, wenn der Spitzname der Person mit diesem Namen entspricht, andernfalls 0. Wie Sie sehen …


2
Gibt es einen Konsens über die Wahl eines geeigneten ML-Ansatzes?
Ich studiere zurzeit Datenwissenschaft und wir lernen eine schwindelerregende Vielfalt grundlegender Regressions- / Klassifizierungstechniken (linear, logistisch, Bäume, Splines, ANN, SVM, MARS usw.) sowie eine Vielzahl von zusätzliche Werkzeuge (Bootstrapping, Boosten, Absacken, Ensemble, Ridge / Lasso, CV usw. usw.). Manchmal erhalten die Techniken einen Kontext (z. B. geeignet für kleine / …

1
Quelle von Arthur Samuels Definition des maschinellen Lernens
Viele Menschen scheinen zuzustimmen, dass Arthur Samuel 1959 schrieb oder sagte, dass maschinelles Lernen das " Studienfeld ist, in dem Computer lernen können, ohne explizit programmiert zu werden ". Zum Beispiel ist das Zitat in enthält dieser Seite , dass eine und Andrew Ng ML Kurs . Einige Artikel enthalten …



2
Wie funktioniert die allgemeine Vorteilsschätzung?
Ich habe schon seit einiger Zeit versucht, GAE zu meiner A2C-Implementierung hinzuzufügen , aber ich kann nicht ganz verstehen, wie es funktioniert. Mein Verständnis davon ist, dass es die Varianz der Vorteilsschätzungsfunktion reduziert, indem die Vorteile basierend auf den Werten im Rollout "gemittelt" (oder verallgemeinert) werden. Ich habe versucht, die …


2
Validierung mit großen Schwankungen. Was könnte die Ursache sein?
Ich trainiere ein CNN für ein 3-Klassen-Bildklassifizierungsproblem. Mein Trainingsverlust nahm reibungslos ab, was das erwartete Verhalten ist. Mein Validierungsverlust zeigt jedoch große Schwankungen. Ist dies etwas, worüber ich mir Sorgen machen sollte, oder sollte ich einfach das Modell auswählen, das bei meinem Leistungsmaß (Genauigkeit) am besten abschneidet? Zusätzliche Informationen: Ich …

3
Unterschied zwischen Indikatorspalte und kategorialer Identitätsspalte im Tensorflow
Ich lerne Tensorflow und bin auf verschiedene Feature-Spalten gestoßen, die in Tensorflow verwendet werden. Von diesen Typen sind zwei categorical_identity_columnund indicator_column. Beide wurden auf die gleiche Weise definiert. Soweit ich weiß, konvertieren beide kategoriale Spalten in One-Hot-codierte Spalten. Meine Frage ist also, was ist der Unterschied zwischen den beiden? Wann …


1
Wie trainiere ich Daten stapelweise von der Festplatte?
Ich arbeite an einem Faltungsnetzwerk zur Bildklassifizierung. Der Trainingsdatensatz ist zu groß, um auf meinen Computerspeicher geladen zu werden (4 GB). Außerdem muss ich eine Erweiterung versuchen, um die Klassen auszugleichen. Ich benutze keras. Ich habe viele Beispiele untersucht, aber keine Lösung für mein Problem gefunden. Ich denke darüber nach, …

2
CNN - Wie funktioniert die Backpropagation mit Gewichtsverteilung genau?
Betrachten Sie ein Convolutional Neural Network (CNN) für die Bildklassifizierung. Um lokale Merkmale zu erkennen, wird die Gewichtsverteilung zwischen Einheiten in derselben Faltungsschicht verwendet. In einem solchen Netzwerk werden die Kernelgewichte über den Backpropagation-Algorithmus aktualisiert. Ein Update für das Kernelgewicht hjhjh_j in Schicht lll wäre wie folgt: hlj=hlj- η⋅δR.δhlj=hlj- η⋅δR.δxL.j⋅δxL.jδxL …

2
Bedeutung der XGBoost-Funktion - Verstärkung und Abdeckung sind hoch, aber die Frequenz ist niedrig
Ich habe diese Frage gelesen: Wie interpretiere ich die Ausgabe von XGBoost wichtig? Informationen zu den drei verschiedenen Arten von Feature-Wichtigkeiten: Häufigkeit (in Python XGBoost als "Gewicht" bezeichnet), Verstärkung und Deckung. In meinem Fall habe ich eine Funktion, Geschlecht, die basierend auf der Frequenzmetrik eine sehr geringe Bedeutung hat, aber …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.