Datenwissenschaftliche Projekte Schritt für Schritt erklärt?


10

Ich suche eine Website oder ein Buch, auf der Schritt für Schritt einige praktische Beispiele gegeben werden, in denen erklärt wird, wie sie die relevanten Funktionen, das Modellauswahlverfahren usw. auswählen.

Antworten:


2

1

Ich hatte vor ein paar Wochen die gleiche Frage.

Ich persönlich fand O'Reillys Python für die Datenanalyse sehr nützlich, um die Grundlagen zu erlernen. Das Buch setzt voraus, dass Sie über einige Programmiererfahrungen in Python verfügen, enthält jedoch auch einen Anhang im Hintergrund, in dem die Grundlagen erläutert werden.

Der Autor gibt Ihnen zu Beginn eine Vielzahl von Beispielen aus der realen Welt (nicht Monty Python), die Sie in den ersten Kapiteln erstellen können, und geht dann im weiteren Verlauf des Buches detailliert auf jede Sache ein und baut Ihr Wissen auf.

Ich fand die Anleitung sehr einfach und Schritt für Schritt. Mein Professor, der mich bei all dem unterstützt, war beeindruckt, wie schnell ich gelernt habe.

Ich habe auch gute Dinge über Kaggle gehört.


1

Data Science in der Cloud mit Microsoft Azure Machine Learning und R ist ein kostenloses Lehrbuch, das ein Beispiel ausführlich behandelt. Lassen Sie sich nicht von den verwendeten Tools abschrecken, da Sie sie nicht benötigen, um einen Nutzen aus dem Buch zu ziehen.

Eine andere, die mir gefallen hat, ist das Programmieren von Collective Intelligence, das auch eine Reihe von Projekten im Detail durchläuft, einschließlich des Web-Scraping-Teils, den die meisten Bücher beschönigen.




0

Eines der besten Bücher, auf das ich gestoßen bin, ist Maschinelles Lernen in Python von Sebastian Raschka. Einfache Beispiele, schrittweise Erklärungen und genau die richtige Menge an Mathematik.

Die Struktur des Buches deckt den gesamten Prozess von der Datenbereinigung bis zur Zusammenstellung und Auswertung ab.


0

Schauen Sie sich an:

https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/

In diesem Schritt-für-Schritt-Tutorial erhalten Sie einen Überblick über den gesamten Prozess der Datenexploration, Datenanalyse und Erstellung eines Vorhersagemodells.

Hier finden Sie Erläuterungen zur Datenexploration und zum Feature-Engineering (Auswahl relevanter Features):

https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/

Sehen Sie sich hier die ersten 5 Datensätze mit Tutorials an und arbeiten Sie daran, um praktische Erfahrungen zu sammeln:

https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/

Schauen Sie sich auch an:

http://machinelearningmastery.com/machine-learning-in-python-step-by-step/

Dabei verwendet er mehrere Modelle für einen einzelnen Datensatz, um Ihnen ein grundlegendes Verständnis der verschiedenen Modelle zu vermitteln.

Weitere Informationen zur Modellauswahl finden Sie hier:

https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection

Der obige Link enthält Antworten von Personen, die vor Ort arbeiten.

Um Einblicke in verschiedene Datensätze zu erhalten, können Sie sich jederzeit bei kaggle anmelden, an Wettbewerben teilnehmen und sich die zahlreichen Datensätze ansehen, in denen Sie auf den Code von Personen in Kerneln zugreifen können. Die Foren in Kaggle sind hilfreich, wenn Leute über die Verwendung verschiedener Modelle für ein Problem und ihren Ansatz diskutieren.

https://www.kaggle.com/

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.