Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

3
Mittlerer absoluter Fehler ODER quadratischer Mittelfehler?
Warum Root Mean Squared Error (RMSE) anstelle von Mean Absolute Error (MAE) verwenden? Hallo Ich habe den in einer Berechnung generierten Fehler untersucht. Anfangs habe ich den Fehler als Root Mean Normalized Squared Error berechnet. Wenn ich etwas genauer hinschaue, sehe ich, dass das Quadrieren des Fehlers größeren Fehlern mehr …
59 least-squares  mean  rms  mae 

6
Prinzipieller Weg, kategoriale Variablen mit vielen Ebenen zu kollabieren?
Welche Techniken stehen zur Verfügung, um viele Kategorien zu einigen zu reduzieren (oder zu bündeln), um sie als Eingabe (Prädiktor) in einem statistischen Modell zu verwenden? Stellen Sie sich eine Variable wie den Hauptfachstudenten vor (Fachbereich, den ein Student im Grundstudium auswählt). Es ist ungeordnet und kategorisch, kann aber möglicherweise …






1
Grundlegendes zur ROC-Kurve
Ich habe Probleme, die ROC-Kurve zu verstehen. Gibt es einen Vorteil / eine Verbesserung in der Fläche unter der ROC-Kurve, wenn ich aus jeder eindeutigen Teilmenge des Trainingssatzes verschiedene Modelle baue und sie zur Erstellung einer Wahrscheinlichkeit verwende? Wenn zum Beispiel Werte von { a , a , a , …
57 r  roc 

1
Warum wird die Quadratwurzeltransformation für Zählungsdaten empfohlen?
Es wird oft empfohlen, die Quadratwurzel zu ziehen, wenn Sie Daten zählen. (Beispiele auf CV finden @ HarveyMotulsky Antwort hier oder @ whuber Antwort hier .) Auf der anderen Seite, wenn ein allgemeines lineares Modell mit einer Reaktionsvariable passend als Poisson verteilte, ist das Protokoll der kanonische Link . Dies …

13
Erhöht 10 Köpfe hintereinander die Wahrscheinlichkeit, dass der nächste Wurf ein Schwanz ist?
Ich gehe davon aus, dass Folgendes zutrifft: Wenn Sie von einer fairen Münze ausgehen und beim Werfen einer Münze 10 Köpfe hintereinander werfen, steigt die Wahrscheinlichkeit, dass die nächste Münze einen Schwanz wirft , nicht, unabhängig von der Wahrscheinlichkeit und / oder dem statistischen Jargon (entschuldigen Sie die Wortspiele). Unter …

7
Beispiele, bei denen die Methode der Momente in kleinen Stichproben die maximale Wahrscheinlichkeit übertrifft?
Maximum Likelihood Estimators (MLE) sind asymptotisch effizient; Wir sehen das praktische Ergebnis darin, dass sie selbst bei kleinen Stichprobengrößen oftmals besser abschätzen als die Momentenmethode (MoM) (wenn sie sich unterscheiden) Hier bedeutet "besser als" in dem Sinne, dass typischerweise eine geringere Varianz vorliegt, wenn beide unverzerrt sind, und typischerweise ein …





Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.