Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

30
Was sind häufige statistische Sünden?
Ich bin ein Diplom-Psychologe, und da ich mehr und mehr selbständige Studien in Statistik mache, staune ich zunehmend über die Unzulänglichkeit meiner formalen Ausbildung. Sowohl die persönliche Erfahrung als auch die Erfahrung aus zweiter Hand legen nahe, dass die statistische Strenge in der Ausbildung von Studenten und Absolventen in der …
227 fallacy 





3
Woher wissen Sie, dass Ihr maschinelles Lernproblem hoffnungslos ist?
Stellen Sie sich ein Standard-Szenario für maschinelles Lernen vor: Sie werden mit einem großen multivariaten Datensatz konfrontiert und haben ein ziemlich verschwommenes Verständnis davon. Was Sie tun müssen, ist, Vorhersagen über eine Variable zu treffen, die auf Ihren Vorstellungen basiert. Wie üblich bereinigen Sie die Daten, sehen sich beschreibende Statistiken …


5
Welches "Mittel" soll verwendet werden und wann?
Wir haben also das arithmetische Mittel (AM), das geometrische Mittel (GM) und das harmonische Mittel (HM). Ihre mathematische Formulierung ist ebenso bekannt wie die zugehörigen stereotypen Beispiele (z. B. das harmonische Mittel und seine Anwendung auf Probleme im Zusammenhang mit der Geschwindigkeit). Eine Frage, die mich schon immer fasziniert hat, …
197 mean 

8
Algorithmen zur automatischen Modellauswahl
Ich möchte einen Algorithmus zur automatischen Modellauswahl implementieren. Ich denke über eine schrittweise Regression nach, aber alles wird funktionieren (es muss jedoch auf linearen Regressionen basieren). Mein Problem ist, dass ich keine Methodik oder Open-Source-Implementierung finden kann (ich woke in Java). Die Methodik, die ich vorhabe, wäre ungefähr so: Berechnen …





15
Was ist ein Datenwissenschaftler?
Nachdem ich kürzlich mein Doktorandenprogramm in Statistik abgeschlossen hatte, hatte ich in den letzten Monaten begonnen, nach einer Arbeit im Bereich Statistik zu suchen. Fast jedes Unternehmen, das ich in Betracht zog, hatte eine Stellenanzeige mit der Berufsbezeichnung " Data Scientist ". Tatsächlich fühlte es sich so an, als wären …

4
Was ist die Stapelgröße im neuronalen Netzwerk?
Ich benutze Python Keras packagefür neuronales Netzwerk. Dies ist der Link . Ist batch_sizegleich der Anzahl von Testproben? Aus Wikipedia haben wir diese Informationen: In anderen Fällen kann das Auswerten des Summengradienten jedoch teure Auswertungen der Gradienten von allen Summandenfunktionen erfordern. Wenn der Trainingssatz riesig ist und keine einfachen Formeln …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.