Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten



1
Neuronale Netze: Wie werden Daten aus der realen Welt vorbereitet, um Ereignisse mit geringer Wahrscheinlichkeit zu erkennen?
Ich habe einen realen Datensatz von Kreditnehmern (50.000 Datensätze). Das Set enthält Kategorien wie Verheiratet, Single, Geschieden usw. sowie fortlaufende Daten wie Einkommen, Alter usw. Einige Datensätze sind unvollständig oder enthalten Ausreißer. Die abhängige Variable ist Standard / Gut (0,1). Wir versuchen, ein neuronales Netzwerk zu trainieren, um Standardwerte basierend …

3
Twitter-Stimmungsanalyse: Erkennen neutraler Tweets trotz Training nur für positive und negative Klassen
Ich bin ein Neuling, wenn es um maschinelles Lernen geht. Ich versuche, praktische Erfahrungen zu sammeln, indem ich verschiedene überwachte Lernalgorithmen mithilfe der Scikit-Learn-Bibliothek von Python analysiere. Ich verwende den sentiment140-Datensatz von 1,6 Millionen Tweets für die Stimmungsanalyse unter Verwendung verschiedener dieser Algorithmen. Ich weiß nicht, ob es eine dumme …

1
Was ist ein "Residual Mapping"?
Ein kürzlich veröffentlichtes Papier von He et al. ( Deep Residual Learning für die Bilderkennung , Microsoft Research, 2015) behauptet, dass sie bis zu 4096 Schichten (keine Neuronen!) Verwenden. Ich versuche das Papier zu verstehen, aber ich stolpere über das Wort "Rest". Könnte mir bitte jemand eine Erklärung / Definition …


2
Training von Deep Nets auf einem normalen Laptop
Wäre es für einen Amateur möglich, der praktische Erfahrungen beim Entwerfen und Trainieren tiefer neuronaler Netze sammeln möchte, einen gewöhnlichen Laptop für diesen Zweck zu verwenden (keine GPU), oder ist es hoffnungslos, gute Ergebnisse zu erzielen? angemessene Zeit ohne einen leistungsstarken Computer / Cluster / GPU? Genauer gesagt handelt es …

2
Wie interpretiere ich einen Entscheidungsbaum richtig?
Ich versuche herauszufinden, ob ich einen online gefundenen Entscheidungsbaum richtig interpretiere. Die abhängige Variable dieses Entscheidungsbaums ist die Bonität, die zwei Klassen hat, schlecht oder gut. Die Wurzel dieses Baums enthält alle 2464 Beobachtungen in diesem Datensatz. Das einflussreichste Attribut zur Bestimmung der Klassifizierung einer guten oder schlechten Bonität ist …


1
Wo genau
Ich habe verstanden, dass SVMs binäre, lineare Klassifizierer sind (ohne den Kernel-Trick). Sie haben Trainingsdaten(xi,yi)(xi,yi)(x_i, y_i) wo xixix_i ist ein Vektor und yich∈ { - 1 , 1 }yi∈{−1,1}y_i \in \{-1, 1\}ist die Klasse. Da es sich um binäre lineare Klassifikatoren handelt, besteht die Aufgabe darin, eine Hyperebene zu finden, …

2
SPARK Mllib: Logistische Regression für mehrere Klassen, wie erhält man die Wahrscheinlichkeiten aller Klassen und nicht die oberste?
Ich benutze LogisticRegressionWithLBFGS, um einen Klassifikator für mehrere Klassen zu trainieren. Gibt es eine Möglichkeit, die Wahrscheinlichkeit aller Klassen (nicht nur der Spitzenkandidatenklasse) zu ermitteln, wenn ich das Modell an neuen unsichtbaren Stichproben teste? PS Ich bin nicht unbedingt verpflichtet, den LBFGS-Klassifikator zu verwenden, möchte aber die logistische Regression in …





Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.