Als «machine-learning» getaggte Fragen

Algorithmen für maschinelles Lernen erstellen ein Modell der Trainingsdaten. Der Begriff "maschinelles Lernen" ist vage definiert; Es umfasst das, was auch als statistisches Lernen, Bestärkungslernen, unbeaufsichtigtes Lernen usw. bezeichnet wird. Fügen Sie immer einen spezifischeren Tag hinzu.

2
Relative Bedeutung einer Reihe von Prädiktoren in einer zufälligen Waldklassifikation in R
Ich möchte die relative Bedeutung von Variablensätzen für ein randomForestKlassifizierungsmodell in R bestimmen . Die importanceFunktion liefert die MeanDecreaseGiniMetrik für jeden einzelnen Prädiktor. Ist es so einfach, diese über jeden Prädiktor in einem Satz zu summieren? Beispielsweise: # Assumes df has variables a1, a2, b1, b2, and outcome rf <- …

2
libsvm Datenformat [geschlossen]
Ich verwende das Tool libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) zur Unterstützung der Vektorklassifizierung. Ich bin jedoch verwirrt über das Format der Eingabedaten. Aus der README: Das Format der Trainings- und Testdatendatei ist: <label> <index1>:<value1> <index2>:<value2> ... . . . Jede Zeile enthält eine Instanz und wird mit einem '\ n'-Zeichen abgeschlossen. …

3
Nutzen des Feature-Engineerings: Warum neue Features basierend auf vorhandenen Features erstellen?
Ich sehe oft Leute, die neue Funktionen basierend auf vorhandenen Funktionen bei einem maschinellen Lernproblem erstellen. Zum Beispiel hier: https://triangleinequality.wordpress.com/2013/09/08/basic-feature-engineering-with-the-titanic-data/ Personen haben die Größe der Familie einer Person als neues Feature betrachtet auf die Anzahl der Brüder, Schwestern und Eltern, die vorhandene Merkmale waren. Aber wozu das? Ich verstehe nicht, …

7
Warum schwankt die Validierungsgenauigkeit?
Ich habe ein vierschichtiges CNN, um die Reaktion auf Krebs mithilfe von MRT-Daten vorherzusagen. Ich benutze ReLU-Aktivierungen, um Nichtlinearitäten einzuführen. Die Zuggenauigkeit und der Verlust nehmen monoton zu bzw. ab. Aber meine Testgenauigkeit beginnt wild zu schwanken. Ich habe versucht, die Lernrate zu ändern und die Anzahl der Schichten zu …

2
Betreutes Lernen, unbeaufsichtigtes Lernen und Bestärkungslernen: Workflow-Grundlagen
Überwachtes Lernen 1) Ein menschliches baut einen Klassifizierer basierend auf Eingabe und Ausgabedaten 2) Dieser Klassifikator wird mit einem Trainingsdatensatz trainiert 3) Dieser Klassifikator wird mit einem Testdatensatz getestet 4) Bereitstellung, wenn die Ausgabe zufriedenstellend ist Um verwendet zu werden, wenn "Ich weiß, wie man diese Daten klassifiziert, ich brauche …

7
Inferenz vs. Schätzung?
Was sind die Unterschiede zwischen "Inferenz" und "Schätzung" im Kontext des maschinellen Lernens ? Als Neuling, ich glaube , dass wir folgern Zufallsvariablen und schätzen die Modellparameter. Ist mein Verständnis richtig? Wenn nicht, was genau sind die Unterschiede und wann soll ich welche verwenden? Und welches ist das Synonym für …

2
Faltungsneuronale Netze: Sind die zentralen Neuronen in der Ausgabe nicht überrepräsentiert?
[Diese Frage wurde auch beim Stapelüberlauf gestellt] Die Frage in Kürze Ich untersuche faltungsbedingte neuronale Netze und glaube, dass diese Netze nicht jedes Eingangsneuron (Pixel / Parameter) gleichwertig behandeln. Stellen Sie sich vor, wir haben ein tiefes Netzwerk (viele Ebenen), das auf ein Eingabebild eine Faltung anwendet. Die Neuronen in …

8
Welche mathematischen Fächer würden Sie vorschlagen, um sich auf Data Mining und maschinelles Lernen vorzubereiten?
Ich versuche, ein selbstgesteuertes Mathematik-Curriculum zusammenzustellen, um mich auf das Erlernen von Data Mining und maschinellem Lernen vorzubereiten. Dies ist darauf zurückzuführen , dass ich Andrew Ngs Maschinenlernkurs in Coursera begonnen habe und das Gefühl hatte, dass ich meine mathematischen Fähigkeiten verbessern musste, bevor ich weitermachen konnte. Ich habe vor …

4
Maschinelles Lernen zum Parsen von Strings?
Ich habe viele Adresszeichenfolgen: 1600 Pennsylvania Ave, Washington, DC 20500 USA Ich möchte sie in ihre Bestandteile zerlegen: street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA Aber natürlich sind die Daten schmutzig: Sie stammen aus vielen Ländern in vielen Sprachen, sind unterschiedlich geschrieben, enthalten Rechtschreibfehler, fehlen, …


4
Optimierung für Precision-Recall-Kurven bei Klassenungleichgewicht
Ich habe eine Klassifizierungsaufgabe mit einer Reihe von Prädiktoren (von denen einer der informativste ist), und ich verwende das MARS- Modell, um meinen Klassifizierer zu konstruieren (ich interessiere mich für ein einfaches Modell und würde glms zur Veranschaulichung verwenden) auch gut). Jetzt habe ich ein großes Klassenungleichgewicht in den Trainingsdaten …




5
Was bedeutet Interaktionstiefe in GBM?
Ich hatte eine Frage zum Interaktionstiefenparameter in gbm in R. Dies mag eine Noob-Frage sein, für die ich mich entschuldige, aber wie zeigt der Parameter, von dem ich glaube, dass er die Anzahl der Endknoten in einem Baum angibt, im Grunde genommen X-way an Interaktion zwischen den Prädiktoren? Ich versuche …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.