Als «machine-learning» getaggte Fragen

Methoden und Prinzipien zum Aufbau von "Computersystemen, die sich mit der Erfahrung automatisch verbessern".

2
Wie verwende ich Cohens Kappa als Bewertungsmetrik in GridSearchCV in Scikit Learn?
Ich habe ein Klassenungleichgewicht im Verhältnis 1:15, dh eine sehr niedrige Ereignisrate. Um die Abstimmungsparameter von GBM in Scikit Learn auszuwählen, möchte ich Kappa anstelle der F1-Punktzahl verwenden. Mein Verständnis ist, dass Kappa eine bessere Metrik als die F1-Punktzahl für das Klassenungleichgewicht ist. Aber ich konnte Kappa als Evaluierungsmetrik in …

1
Kategorisierung von Ansätzen zum Umgang mit unausgeglichenen Klassen
Was ist der beste Weg, um die Ansätze zu kategorisieren, die entwickelt wurden, um das Problem der Ungleichgewichtsklassen zu lösen? Dieser Artikel kategorisiert sie in: Vorverarbeitung: umfasst Oversampling, Undersampling und Hybridmethoden, Kostensensitives Lernen: Umfasst direkte Methoden und Meta-Lernen, das letztere weiter in Schwellenwerte und Stichproben unterteilt. Ensemble-Techniken: Umfasst kostensensitive Ensembles …



2
Warum sagt die Gradient Boosting-Regression negative Werte voraus, wenn mein Trainingssatz keine negativen y-Werte enthält?
Als ich die Anzahl der Bäume erhöhe in scikit lernen ist GradientBoostingRegressor, erhalte ich negative Prognosen, auch wenn es in meiner Ausbildung oder Testsatz keine negativen Werte sind. Ich habe ungefähr 10 Funktionen, von denen die meisten binär sind. Einige der Parameter, die ich eingestellt habe, waren: die Anzahl der …



1
Wie verwende ich SMOTE in der Java Weka API?
Ich versuche, ein Klassifizierungsmodell mit der Java Weka API zu erstellen. Mein Trainingsdatensatz weist Probleme mit dem Klassenungleichgewicht auf. Aus diesem Grund möchte ich SMOTE verwenden, um das Problem des Klassenungleichgewichts zu verringern. Ich weiß jedoch nicht, wie ich es in der Java Weka API verwenden soll.


2
Warum wird das F-Maß für Klassifizierungsaufgaben bevorzugt?
Warum wird das F-Maß normalerweise für (überwachte) Klassifizierungsaufgaben verwendet, während das G-Maß (oder der Fowlkes-Mallows-Index) im Allgemeinen für (unbeaufsichtigte) Clustering-Aufgaben verwendet wird? Das F-Maß ist das harmonische Mittel der Präzision und des Rückrufs . Das G-Maß (oder der Fowlkes-Mallows-Index) ist das geometrische Mittel der Präzision und des Rückrufs . Unten …

1
Was ist die genaue Definition der VC-Dimension?
Ich studiere maschinelles Lernen aus Andrew Ng Stanford-Vorlesungen und bin gerade auf die Theorie der VC-Dimensionen gestoßen. Gemäß den Vorlesungen und dem, was ich verstanden habe, kann die Definition der VC-Dimension wie folgt angegeben werden: Wenn Sie eine Menge von Punkten finden können, so dass sie vom Klassifikator zerschmettert werden …


2
Die Mathematik von AdaGrad und AdaDelta verstehen
Ich habe einige Modelle für ein Projekt erstellt, aber ich kann mich nicht mit der Mathematik der Adagrad- und Adadelta-Algorithmen befassen. Ich verstehe, wie Vanille-Gradienten-Abstieg funktioniert, und ich habe Code geschrieben, damit er erfolgreich funktioniert. Ich wäre dankbar, wenn mir jemand diese beiden Dinge erklären oder eine Ressource bereitstellen würde, …

1
Faltungsnetzwerk zur Klassifizierung, äußerst lichtempfindlich
Ich habe ein Faltungsnetzwerk trainiert, um Bilder einer mechanischen Komponente als gut oder fehlerhaft zu klassifizieren. Obwohl die Testgenauigkeit hoch war, stellte ich fest, dass das Modell bei Bildern mit leicht unterschiedlicher Beleuchtung eine schlechte Leistung zeigte. Die Funktionen, die ich zu erkennen versuche, sind subtil, und die Beleuchtung scheint …

5
Clustering mit Kosinusähnlichkeit
Ich habe einen großen Datensatz und eine Kosinusähnlichkeit zwischen ihnen. Ich möchte sie mit Cosinus-Ähnlichkeit gruppieren, die ähnliche Objekte zusammenfügt, ohne vorher die Anzahl der erwarteten Cluster angeben zu müssen. Ich habe die sklearn-Dokumentation von DBSCAN und Affinity Propagation gelesen, in der beide eine Distanzmatrix (keine Kosinus-Ähnlichkeitsmatrix) benötigen. Wirklich, ich …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.