Data Science classification

2

Wie verwende ich einen benutzerdefinierten Stoppwortfilter in der Java Weka-API?

Ich verwende die Java Weka API, um ein Klassifizierungsmodell zu erstellen. Ich kann den eingebauten Stoppwortfilter verwenden. Ich muss jedoch einen benutzerdefinierten Filter für mein Problem verwenden. Ich weiß nicht, wie man einen benutzerdefinierten Stoppwortfilter in der Java Weka API verwendet.

8 classification java weka

1

Wie kann ich die AUC aus der ROC-Kurve für die Klassifizierung berechnen?

Basierend auf TPR und FPR habe ich eine ROC-Kurve für mein binäres Klassifizierungsmodell generiert. Ich weiß nicht, wie ich den AUC-Wert berechnen soll. Ich wäre sehr hilfreich für mich, wenn Sie mir bei der Berechnung des AUC-Werts helfen können.

8 machine-learning classification

1

Was ist die genaue Definition der VC-Dimension?

Ich studiere maschinelles Lernen aus Andrew Ng Stanford-Vorlesungen und bin gerade auf die Theorie der VC-Dimensionen gestoßen. Gemäß den Vorlesungen und dem, was ich verstanden habe, kann die Definition der VC-Dimension wie folgt angegeben werden: Wenn Sie eine Menge von Punkten finden können, so dass sie vom Klassifikator zerschmettert werden …

8 machine-learning classification vc-theory

1

Faltungsnetzwerk zur Klassifizierung, äußerst lichtempfindlich

Ich habe ein Faltungsnetzwerk trainiert, um Bilder einer mechanischen Komponente als gut oder fehlerhaft zu klassifizieren. Obwohl die Testgenauigkeit hoch war, stellte ich fest, dass das Modell bei Bildern mit leicht unterschiedlicher Beleuchtung eine schlechte Leistung zeigte. Die Funktionen, die ich zu erkennen versuche, sind subtil, und die Beleuchtung scheint …

8 machine-learning classification deep-learning image-classification

1

Können die linear nicht trennbaren Daten mithilfe von Polynommerkmalen mit logistischer Regression gelernt werden?

Ich weiß, dass Polynomial Logistic Regressionman damit leicht typische Daten wie das folgende Bild lernen kann: Ich habe mich gefragt, ob die folgenden beiden Daten auch mit gelernt werden können oder nicht. Polynomial Logistic Regression Ich muss wohl noch mehr Erklärungen hinzufügen. Nehmen Sie die erste Form an. Wenn wir …

8 machine-learning classification

2

Warum zerstört eine Überanpassung nicht die neuronalen Netze für die MNIST-Klassifizierung?

Ich habe ein einfaches neuronales Netzwerk (NN) für die MNIST-Klassifizierung. Es enthält 2 versteckte Schichten mit jeweils 500 Neuronen. Daher sind die Abmessungen des NN: 784-500-500-10. ReLU wird in allen Neuronen verwendet, Softmax wird am Ausgang verwendet und Kreuzentropie ist die Verlustfunktion. Was mich verwundert ist, warum Überanpassung den NN …

8 machine-learning neural-network classification overfitting

1

Gibt es eine Domäne, in der Spiking Neural Networks andere Algorithmen übertreffen (Non-Spiking)?

Ich lese über Reservoir-Computing- Techniken wie Echo State Networks und Liquid State Machines . Beide Verfahren umfassen das Zuführen von Eingaben zu einer Population zufällig (oder nicht) verbundener Spike-Neuronen und einen relativ einfachen Auslesealgorithmus, der die Ausgabe erzeugt (z. B. lineare Regression). Die Neuronenpopulationsgewichte werden entweder festgelegt oder über eine …

8 machine-learning classification neural-network deep-learning svm

4

Wie lerne ich die Erkennung von Spam-E-Mails?

Ich möchte erfahren, wie ein Spam-E-Mail-Detektor funktioniert. Ich versuche nicht, ein kommerzielles Produkt zu bauen, es wird eine ernsthafte Lernübung für mich sein. Daher suche ich nach Ressourcen wie vorhandenen Projekten, Quellcode, Artikeln, Artikeln usw., denen ich folgen kann. Ich möchte anhand von Beispielen lernen, ich glaube nicht, dass ich …

8 machine-learning classification text-mining

1

Welche Klassifizierungsalgorithmen sollten Sie versuchen, um Textdaten in 300 Kategorien zu klassifizieren?

Ich habe 40000 Zeilen Textdaten der Gesundheitsdomäne. Daten haben eine Spalte für Text (2-5 Sätze) und eine Spalte für ihre Kategorie. Ich möchte das in 300 Kategorien einteilen. Einige Kategorien sind unabhängig, während andere etwas verwandt sind. Die Verteilung der Daten auf die Kategorien ist ebenfalls nicht einheitlich, dh einige …

8 machine-learning classification nlp text-mining

1

Dokumentklassifizierung: tf-idf vor oder nach der Feature-Filterung?

Ich habe ein Dokumentklassifizierungsprojekt, bei dem ich den Inhalt der Website erhalte und der Website dann eine von zahlreichen Beschriftungen entsprechend dem Inhalt zuweise. Ich fand heraus, dass tf-idf dafür sehr nützlich sein könnte. Ich war mir jedoch nicht sicher, wann ich es genau verwenden sollte. Die Annahme, dass eine …

8 classification feature-selection feature-extraction

2

Verwendung von NLP zur Automatisierung der Kategorisierung der Benutzerbeschreibung

Ich habe eine große Anzahl von Kundenbeschwerden über die Produkte, die mein Unternehmen besitzt, und ich möchte eine Datenanalyse dieser Beschreibungen durchführen und jedem von ihnen eine Kategorie zuordnen. Beispiel: Ich muss die Anzahl der Beschwerden auf der Software- und Hardwareseite meines Produkts anhand der Kundenbeschwerden ermitteln. Derzeit verwende ich …

8 data-mining classification nlp categorical-data

1

Unterschied zwischen tf-idf und tf mit zufälligen Wäldern

Ich arbeite an einem Problem bei der Textklassifizierung mit Random Forest als Klassifizierer und einem Ansatz mit vielen Wörtern. Ich verwende die grundlegende Implementierung von Random Forests (die in Scikit enthaltene), die bei jedem Split eine binäre Bedingung für eine einzelne Variable erstellt. In Anbetracht dessen gibt es einen Unterschied …

8 classification text-mining random-forest

2

So erhalten Sie eine aggregierte Verwirrungsmatrix aus n verschiedenen Klassifikationen

Ich möchte die Genauigkeit einer Methodik testen. Ich habe es ~ 400 Mal ausgeführt und für jeden Lauf eine andere Klassifizierung erhalten. Ich habe auch die Grundwahrheit, dh die wirkliche Klassifikation, gegen die ich testen kann. Für jede Klassifikation habe ich eine Verwirrungsmatrix berechnet. Jetzt möchte ich diese Ergebnisse aggregieren, …

8 classification confusion-matrix accuracy

2

Gibt es einen Konsens über die Wahl eines geeigneten ML-Ansatzes?

Ich studiere zurzeit Datenwissenschaft und wir lernen eine schwindelerregende Vielfalt grundlegender Regressions- / Klassifizierungstechniken (linear, logistisch, Bäume, Splines, ANN, SVM, MARS usw.) sowie eine Vielzahl von zusätzliche Werkzeuge (Bootstrapping, Boosten, Absacken, Ensemble, Ridge / Lasso, CV usw. usw.). Manchmal erhalten die Techniken einen Kontext (z. B. geeignet für kleine / …

8 machine-learning neural-network deep-learning classification data-science-model

1

Was ist die beste Methode zur Klassifizierung von Zeitreihendaten? Sollte ich LSTM oder eine andere Methode verwenden?

Ich versuche, die rohen Beschleunigungsmesserdaten x, y, z der entsprechenden Bezeichnung zuzuordnen. Was ist die beste Architektur für beste Ergebnisse? Oder hat jemand Vorschläge zu LSTM-Architekturen, die auf Keras mit Eingabe- und Ausgabeknoten basieren?

8 classification keras time-series lstm multiclass-classification

Als «classification» getaggte Fragen