Data Science machine-learning

7

Datenwissenschaftliche Projekte Schritt für Schritt erklärt?

Ich suche eine Website oder ein Buch, auf der Schritt für Schritt einige praktische Beispiele gegeben werden, in denen erklärt wird, wie sie die relevanten Funktionen, das Modellauswahlverfahren usw. auswählen.

10 machine-learning feature-selection

1

Mehrere Bezeichnungen im überwachten Lernalgorithmus

Ich habe einen Textkorpus mit entsprechenden Themen. Zum Beispiel "A rapper Tupac was shot in LA"und es wurde als bezeichnet ["celebrity", "murder"]. Grundsätzlich kann jeder Merkmalsvektor viele Beschriftungen haben (nicht die gleiche Menge. Der erste Merkmalsvektor kann 3 Beschriftungen haben, die zweite 1, die dritte 5). Wenn ich nur eine …

10 machine-learning text-mining

2

Bibliotheken für maschinelles Online-Lernen

Ich suche nach Paketen (entweder in Python, R oder einem eigenständigen Paket), um Online-Lernen zur Vorhersage von Bestandsdaten durchzuführen. Ich habe Vowpal Wabbit ( https://github.com/JohnLangford/vowpal_wabbit/wiki ) gefunden und gelesen , was ziemlich vielversprechend zu sein scheint, aber ich frage mich, ob es noch andere Pakete gibt. Danke im Voraus.

10 machine-learning online-learning

2

zeitliche Differenz im Schach umsetzen

Ich habe ein Schachprogramm entwickelt, das einen Alpha-Beta-Bereinigungsalgorithmus und eine Bewertungsfunktion verwendet, die Positionen unter Verwendung der folgenden Merkmale bewertet, nämlich Material, Königssicherheit, Mobilität, Bauernstruktur und gefangene Figuren usw. ..... Meine Bewertungsfunktion ist abgeleitet von der f(p)=w1⋅material+w2⋅kingsafety+w3⋅mobility+w4⋅pawn-structure+w5⋅trapped piecesf(p)=w1⋅material+w2⋅kingsafety+w3⋅mobility+w4⋅pawn-structure+w5⋅trapped piecesf(p) = w_1 \cdot \text{material} + w_2 \cdot \text{kingsafety} + w_3 \cdot …

10 machine-learning algorithms reinforcement-learning

4

Welche ersten Schritte sollte ich ausführen, um große Datenmengen zu verstehen, und welche Tools sollte ich verwenden?

Vorsichtsmaßnahme: Ich bin ein absoluter Anfänger, wenn es um maschinelles Lernen geht, aber lernbegierig. Ich habe einen großen Datensatz und versuche, darin ein Muster zu finden. Es kann / kann keine Korrelation zwischen den Daten geben, entweder mit bekannten Variablen oder Variablen, die in den Daten enthalten sind, aber die …

10 machine-learning data-mining tools beginner

3

Statistik + Informatik = Datenwissenschaft? [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Daten Wissenschaft Stapel Börse. Geschlossen vor 5 Jahren . Ich möchte Datenwissenschaftler werden . Ich habe angewandte Statistik studiert (Versicherungsmathematik), daher habe …

10 machine-learning statistics career

1

Vorhersage mit nichtatomaren Merkmalen

Ich möchte nichtatomare Daten als Merkmal für eine Vorhersage verwenden. Angenommen, ich habe eine Tabelle mit folgenden Funktionen: - Column 1: Categorical - House - Column 2: Numerical - 23.22 - Column 3: A Vector - [ 12, 22, 32 ] - Column 4: A Tree - [ [ 2323, …

10 machine-learning

3

Umgang mit einem regelmäßig wachsenden Funktionsumfang

Ich arbeite an einem Betrugserkennungssystem. In diesem Bereich treten regelmäßig neue Betrugsfälle auf, sodass dem Modell laufend neue Funktionen hinzugefügt werden müssen. Ich frage mich, wie ich am besten damit umgehen kann (aus Sicht des Entwicklungsprozesses). Das Hinzufügen eines neuen Features zum Feature-Vektor und das erneute Training des Klassifikators scheint …

10 machine-learning bigdata

3

Wie codiere ich eine Klasse mit 24.000 Kategorien?

Ich arbeite derzeit an einem logistischen Regressionsmodell für die Genomik. Eines der Eingabefelder, die ich als Kovariate einschließen möchte, ist genes. Es sind rund 24.000 Gene bekannt. Es gibt viele Merkmale mit dieser Variabilität in der Computerbiologie, und Hunderttausende von Proben werden benötigt. Wenn ich LabelEncoder()diese 24K-Gene und dann OneHotEncoder()sie …

10 machine-learning keras scikit-learn

5

Wann korrelierte Variablen entfernt werden sollen

Kann jemand bitte vorschlagen, was der richtige Schritt ist, um korrelierte Variablen vor dem Feature-Engineering oder nach dem Feature-Engineering zu entfernen?

10 machine-learning feature-selection data-science-model

3

Mittelwert Null und Einheitsvarianz

Ich studiere Datenskalierung und insbesondere die Standardisierungsmethode. Ich habe die Mathematik dahinter verstanden, aber mir ist nicht klar, warum es wichtig ist, den Merkmalen den Mittelwert Null und die Einheitsvarianz zu geben. Kannst du mir erklären ?

10 machine-learning feature-scaling normalization

4

Wird PCA als Algorithmus für maschinelles Lernen angesehen?

Ich habe verstanden, dass die Hauptkomponentenanalyse eine Technik zur Reduzierung der Dimensionalität ist, dh bei 10 Eingabemerkmalen wird eine geringere Anzahl unabhängiger Merkmale erzeugt, die eine orthogonale und lineare Transformation der ursprünglichen Merkmale darstellen. Wird PCAan sich als Lernalgorithmus betrachtet oder ist ein Datenvorverarbeitungsschritt.

10 machine-learning pca

3

Können GPS-Koordinaten (Längen- und Breitengrad) als Merkmale in einem linearen Modell verwendet werden?

Ich habe Datensätze, die unter anderem GPS-Koordinaten (Längen- und Breitengrad) enthalten. Ich möchte diese Datensätze verwenden, um Probleme zu untersuchen wie: (1) Berechnen der ETA, um zwischen Start- und Endpunkten zu fahren; und (2) Schätzen des Ausmaßes der Kriminalität für einen bestimmten Punkt. Ich möchte ein lineares Regressionsmodell verwenden. Kann …

10 machine-learning feature-selection linear-regression feature-extraction geospatial

2

Keras Multiple "Softmax" in der letzten Schicht möglich?

Ist es möglich, mehrere Softmaxe in der letzten Schicht in Keras zu implementieren? Also ist die Summe der Knoten 1-4 = 1; 5-8 = 1; usw. Sollte ich mich für ein anderes Netzwerkdesign entscheiden?

10 machine-learning keras multiclass-classification

2

Wie führe ich eine logistische Regression mit einer großen Anzahl von Funktionen durch?

Ich habe einen Datensatz mit 330 Stichproben und 27 Merkmalen für jede Stichprobe mit einem Binärklassenproblem für die logistische Regression. Gemäß der "Regel wenn zehn" benötige ich mindestens 10 Ereignisse für jedes Feature, um eingeschlossen zu werden. Ich habe jedoch einen unausgeglichenen Datensatz mit 20% positiver Klasse und 80% negativer …

10 machine-learning python predictive-modeling logistic-regression data

Als «machine-learning» getaggte Fragen