Als «machine-learning» getaggte Fragen

Algorithmen für maschinelles Lernen erstellen ein Modell der Trainingsdaten. Der Begriff "maschinelles Lernen" ist vage definiert; Es umfasst das, was auch als statistisches Lernen, Bestärkungslernen, unbeaufsichtigtes Lernen usw. bezeichnet wird. Fügen Sie immer einen spezifischeren Tag hinzu.

3
Wie ist die Kausalität mathematisch definiert?
Was ist die mathematische Definition eines Kausalzusammenhangs zwischen zwei Zufallsvariablen? Wann würde man bei einer Stichprobe aus der gemeinsamen Verteilung zweier Zufallsvariablen und sagen, dass verursacht ?XXXYYYXXXYYY Zum Kontext lese ich dieses Papier über die kausale Entdeckung .


4
Was ist ein guter Protokollverlust?
Ich versuche, den Protokollverlust und seine Funktionsweise besser zu verstehen, aber eine Sache, die ich nicht zu finden scheine, ist, die Protokollverlustnummer in einen Kontext zu setzen. Wenn mein Modell einen log-Verlust von 0,5 hat, ist das gut? Was ist ein gutes und ein schlechtes Ergebnis? Wie verändern sich diese …

5
Wie übertreffen Ensemble-Methoden alle ihre Bestandteile?
Ich bin ein bisschen verwirrt über das Lernen von Ensembles. Kurz gesagt, es werden k Modelle ausgeführt und der Durchschnitt dieser k Modelle ermittelt. Wie kann garantiert werden, dass der Durchschnitt der k Modelle besser ist als jeder der Modelle für sich? Ich verstehe, dass die Tendenz "ausgebreitet" oder "gemittelt" …

2
Was passiert hier, wenn ich bei der Einstellung der logistischen Regression den quadratischen Verlust verwende?
Ich versuche, einen quadratischen Verlust zu verwenden, um eine binäre Klassifizierung für einen Spielzeugdatensatz durchzuführen. Ich verwende einen mtcarsDatensatz, verwende Meile pro Gallone und Gewicht, um die Übertragungsart vorherzusagen. Das folgende Diagramm zeigt die zwei Arten von Übertragungstypdaten in verschiedenen Farben und die Entscheidungsgrenze, die durch verschiedene Verlustfunktionen erzeugt werden. …

1
Welche Kausaltheorien sollte ich kennen?
Welche theoretischen Herangehensweisen an die Kausalität sollte ich als angewandter Statistiker / Ökonometriker kennen? Ich kenne die (ein bisschen) Neyman-Rubin-Kausalmodell (und Roy , Haavelmo usw.) Pearl's Arbeit über Kausalität Granger-Kausalität (wenn auch weniger behandlungsorientiert) Welche Konzepte vermisse ich oder sollte ich darauf achten? Verwandte: Welche Theorien sind Grundlagen für Kausalität …


2
Durchführung einer explorativen Datenanalyse zur Auswahl eines geeigneten Algorithmus für maschinelles Lernen
Wir studieren maschinelles Lernen durch maschinelles Lernen: Eine probabilistische Perspektive (Kevin Murphy). Während der Text die theoretische Grundlage jedes Algorithmus erklärt, sagt er selten, in welchem ​​Fall welcher Algorithmus besser ist, und wenn ja, sagt er nicht, wie man sagt, in welchem ​​Fall ich bin. Zum Beispiel wurde mir bei …

1
Klassifikator gegen Modell gegen Schätzer
Was ist der Unterschied zwischen einem Klassifikator, einem Modell und einem Schätzer? Soweit ich das beurteilen kann: Ein Schätzer ist ein Prädiktor, der aus einem Regressionsalgorithmus ermittelt wird Ein Klassifikator ist ein Prädiktor, der aus einem Klassifikationsalgorithmus ermittelt wird Ein Modell kann sowohl ein Schätzer als auch ein Klassifikator sein …


3
Fläche unter der ROC-Kurve oder Fläche unter der PR-Kurve für unausgeglichene Daten?
Ich habe einige Zweifel, welches Leistungsmaß verwendet werden soll, Bereich unter der ROC-Kurve (TPR als Funktion von FPR) oder Bereich unter der Genauigkeits-Rückruf-Kurve (Genauigkeit als Funktion von Rückruf). Meine Daten sind unausgewogen, dh die Anzahl der negativen Instanzen ist viel größer als die der positiven Instanzen. Ich benutze die Ausgabe …


2
Einklassen-SVM vs. exemplarische SVM
Ich verstehe, dass Ein-Klassen-SVMs (OSVMs) ohne Berücksichtigung negativer Daten vorgeschlagen wurden und dass sie nach Entscheidungsgrenzen suchen, die eine positive Menge und einen negativen Ankerpunkt, beispielsweise den Ursprung, trennen. Eine Arbeit aus dem Jahr 2011 schlägt beispielhafte SVMs (ESVMs) vor, die einen "einzelnen Klassifikator pro Kategorie" ausbilden, der sich von …

2
Trainingsansätze für stark unausgeglichene Datensätze
Ich habe einen stark unausgeglichenen Testdatensatz. Die positive Menge besteht aus 100 Fällen, während die negative Menge aus 1500 Fällen besteht. Auf der Trainingsseite habe ich einen größeren Kandidatenpool: Der positive Trainingssatz umfasst 1200 Fälle und der negative Trainingssatz umfasst 12000 Fälle. Für diese Art von Szenario habe ich mehrere …

2
Leidet die GBM-Klassifizierung unter unausgewogenen Klassengrößen?
Ich habe es mit einem Problem der überwachten binären Klassifizierung zu tun. Ich möchte das GBM-Paket verwenden, um Personen als nicht infiziert / infiziert zu klassifizieren. Ich habe 15-mal mehr nicht infizierte als infizierte Personen. Ich habe mich gefragt, ob GBM-Modelle unter unausgeglichenen Klassengrößen leiden? Ich habe keine Referenzen gefunden, …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.