Als «data-mining» getaggte Fragen

Data Mining verwendet Methoden der künstlichen Intelligenz in einem Datenbankkontext, um bisher unbekannte Muster zu ermitteln. Daher sind die Methoden normalerweise unbeaufsichtigt. Es ist eng verwandt, aber nicht identisch mit maschinellem Lernen. Hauptaufgaben des Data Mining sind die Clusteranalyse, die Erkennung von Ausreißern und das Mining von Zuordnungsregeln.

2
Wie kann man basierend auf früheren Ereignissen vorhersagen, wann das nächste Ereignis eintritt?
Ich bin ein Gymnasiast und arbeite an einem Computerprogrammierungsprojekt, aber ich habe nicht viel Erfahrung mit Statistik und Modellierung von Daten außerhalb eines High School Statistikkurses, daher bin ich ein bisschen verwirrt. Grundsätzlich habe ich eine ziemlich große Liste (vorausgesetzt, sie ist groß genug, um die Annahmen für statistische Tests …




2
Trainingsansätze für stark unausgeglichene Datensätze
Ich habe einen stark unausgeglichenen Testdatensatz. Die positive Menge besteht aus 100 Fällen, während die negative Menge aus 1500 Fällen besteht. Auf der Trainingsseite habe ich einen größeren Kandidatenpool: Der positive Trainingssatz umfasst 1200 Fälle und der negative Trainingssatz umfasst 12000 Fälle. Für diese Art von Szenario habe ich mehrere …

3
Was ist Datenmischung?
Dieser Begriff kommt häufig in methodenbezogenen Threads vor . Ist das Mischen eine bestimmte Methode für Data Mining und statistisches Lernen? Ich kann kein relevantes Ergebnis von Google erhalten. Es scheint, dass das Mischen die Ergebnisse vieler Modelle verwechselt und zu einem besseren Ergebnis führt. Gibt es eine Ressource, die …

10
Eine Übersicht über Data Mining-Softwaretools
Obwohl ich als Ingenieur ausgebildet wurde, interessiere ich mich immer mehr für Data Mining. Im Moment versuche ich, das Feld weiter zu untersuchen. Insbesondere möchte ich die verschiedenen Kategorien von Softwaretools verstehen, die existieren und welche Tools in jeder Kategorie bemerkenswert sind und warum. (Beachten Sie, dass ich nicht die …

4
Bedeutung latenter Merkmale?
Ich versuche, Matrixfaktorisierungsmodelle für Empfehlungssysteme zu verstehen und lese immer "latente Merkmale", aber was bedeutet das? Ich weiß, was eine Funktion für einen Trainingsdatensatz bedeutet, kann aber die Idee latenter Funktionen nicht verstehen. Jedes Papier zu dem Thema, das ich finden kann, ist einfach zu flach. Bearbeiten: wenn Sie mir …

1
Der Unterschied zwischen logistischer Regression und Support Vector Machines?
Ich weiß, dass die logistische Regression eine Hyperebene findet, die die Trainingsmuster trennt. Ich weiß auch, dass Support-Vektor-Maschinen die Hyperebene mit der maximalen Marge finden. Meine Frage: Ist der Unterschied zwischen logistischer Regression (LR) und Support Vector Machines (SVM), dass LR eine Hyperebene findet, die die Trainingsmuster trennt, während SVM …

3
Warum verwenden wir k-means anstelle anderer Algorithmen?
Ich habe über k-means recherchiert und das habe ich: k-means ist einer der einfachsten Algorithmen, der unbeaufsichtigte Lernmethoden verwendet, um bekannte Clustering-Probleme zu lösen. Es funktioniert sehr gut mit großen Datenmengen. Es gibt jedoch auch Nachteile von K-Mitteln, die sind: Starke Empfindlichkeit gegenüber Ausreißern und Lärm Funktioniert nicht gut mit …





2
Was sind die bekannten praktischen Anwendungen der Chaostheorie im Data Mining?
Während ich in den letzten Jahren gelegentlich einige Massenmarktwerke zur Chaostheorie las, begann ich mich zu fragen, wie verschiedene Aspekte davon auf Data Mining und verwandte Bereiche wie neuronale Netze, Mustererkennung, Unsicherheitsmanagement usw. angewendet werden könnten Ich habe so wenige Beispiele für solche Anwendungen in der veröffentlichten Forschung gefunden, dass …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.