Data Mining-Papiere / Beispiele


8

Ich suche nach mittelgroßen bis langen Artikeln / Websites / usw. zum Thema Data Mining, insbesondere dort, wo ein Datensatz von der Datenaufbereitung bis zum endgültigen Modell eingehend untersucht wird. Ich interessiere mich besonders für Diskussionen über die Anwendung von Algen des maschinellen Lernens und auch über die grundlegende Datenmodellierung. Ein Beispiel wäre Luis Torgos Buch 'Data Mining with R'. Anregungen wäre dankbar.


1
Interessieren Sie sich für alle Methoden des Data Mining oder nur für eine bestimmte Methode?
Michelle

Ich werde nehmen, was ich bekommen kann.
ScreechOwl

Ich bin auf der Suche nach spezifischeren Informationen darüber, wie man durch einen bestimmten Datensatz geht. Einige der KDD Cup-Zuschreibungen von Gewinnerteams entsprechen dem, wonach ich suche. Grundsätzlich Narrative zum Umgang mit Problemen, die für einen bestimmten Datensatz spezifisch sind. Die Analogie wäre eine Fallstudie an einer Business School, in der eine Situation in einem Unternehmen ausführlich besprochen wird.
ScreechOwl

Antworten:


4

Besuchen Sie den Kaggle.com-Blog , in dem die Gewinner ihre Ansätze zur Lösung eines Data Mining-Wettbewerbs diskutieren. Sie können dann zur Website kaggle.com zurückkehren, um die Beschreibung und die Daten abzurufen und selbst auszuprobieren.



2

Ich empfehle Ihnen Artikel aus dem kostenlosen Journal of Statistical Software.

Dort finden Sie verschiedene Anwendungen des Data Mining / Maschinellen Lernens zusammen mit der Analyse realer Datenbeispiele. Die meisten Artikel befassen sich mit R-Paketen, sodass Sie ihre Analysen auch gleichzeitig in R durchführen können. Artikel im Journal enthalten auch R-Code und Pakete in R enthalten Daten.

Alle Daten werden dort eingehend analysiert, so dass es für mich eine sehr wertvolle Quelle ist.


1

Das Caret R-Paket enthält einen Satz von vier Vignetten, die verschiedene Datenaufbereitungsaufgaben, überwachte Lernalgorithmen, Funktionsauswahl und Datenvisualisierungen ausgehend von einigen Beispieldatensätzen ausführen.

Obwohl der Schwerpunkt darauf liegt, wie diese Dinge mit den von Caret selbst bereitgestellten Funktionen ausgeführt werden können, ist sie dennoch allgemein anwendbar und für reale Projekte ziemlich gut lesbar.

Hier sind direkte Links zu den vier PDF-Vignetten:


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.