Statistiken und Big Data

3

Mittlerer absoluter Fehler ODER quadratischer Mittelfehler?

Warum Root Mean Squared Error (RMSE) anstelle von Mean Absolute Error (MAE) verwenden? Hallo Ich habe den in einer Berechnung generierten Fehler untersucht. Anfangs habe ich den Fehler als Root Mean Normalized Squared Error berechnet. Wenn ich etwas genauer hinschaue, sehe ich, dass das Quadrieren des Fehlers größeren Fehlern mehr …

59 least-squares mean rms mae

6

Prinzipieller Weg, kategoriale Variablen mit vielen Ebenen zu kollabieren?

Welche Techniken stehen zur Verfügung, um viele Kategorien zu einigen zu reduzieren (oder zu bündeln), um sie als Eingabe (Prädiktor) in einem statistischen Modell zu verwenden? Stellen Sie sich eine Variable wie den Hauptfachstudenten vor (Fachbereich, den ein Student im Grundstudium auswählt). Es ist ungeordnet und kategorisch, kann aber möglicherweise …

58 regression categorical-data dimensionality-reduction feature-construction many-categories

6

Was ist ein "gesättigtes" Modell?

Was ist gemeint, wenn wir sagen, wir haben ein gesättigtes Modell?

58 modeling regression

3

Was ist der Unterschied zwischen Feed-Forward- und rekurrenten neuronalen Netzen?

Was ist der Unterschied zwischen einem Feed-Forward- und einem rekurrenten neuronalen Netzwerk? Warum würden Sie eine übereinander verwenden? Gibt es andere Netzwerktopologien?

58 machine-learning neural-networks terminology rnn topologies

11

Rätsel: Wie man mit einer voreingenommenen Münze mit einem pr (Kopf) = p 7 ganze Zahlen mit gleicher Wahrscheinlichkeit erzeugt?

Dies ist eine Frage, die ich bei Glassdoor gefunden habe : Wie erzeugt man mit einer Münze mit einem 7 Ganzzahlen mit gleicher Wahrscheinlichkeit ?P r ( Kopf ) = p ∈ ( 0 , 1 )Pr(Head)=p∈(0,1)\mathbb{Pr}(\text{Head}) = p\in(0,1) Grundsätzlich haben Sie eine Münze, die fair sein kann oder nicht, …

58 probability binomial random-generation

2

Wie kann ich den Titel einer Legende in ggplot2 ändern? [geschlossen]

Ich habe ein Diagramm in ggplot2 erstellt, um Daten aus einem Datensatz mit 2 x 4 x 3 Zellen zusammenzufassen. Ich war in der Lage, Panels für die 2-stufige Variable mit facet_grid(. ~ Age)zu erstellen und die x- und y-Achse mit einzustellen aes(x=4leveledVariable, y=DV). aes(group=3leveledvariable, lty=3leveledvariable)Bisher habe ich die Handlung …

58 r data-visualization ggplot2

7

Wie funktioniert der Umparametrierungstrick für VAEs und warum ist das wichtig?

Wie funktioniert der Umparametrierungstrick für Variations-Autoencoder (VAE)? Gibt es eine intuitive und einfache Erklärung, ohne die zugrunde liegende Mathematik zu vereinfachen? Und warum brauchen wir den "Trick"?

57 mathematical-statistics autoencoders variational-bayes generative-models

1

Grundlegendes zur ROC-Kurve

Ich habe Probleme, die ROC-Kurve zu verstehen. Gibt es einen Vorteil / eine Verbesserung in der Fläche unter der ROC-Kurve, wenn ich aus jeder eindeutigen Teilmenge des Trainingssatzes verschiedene Modelle baue und sie zur Erstellung einer Wahrscheinlichkeit verwende? Wenn zum Beispiel Werte von { a , a , a , …

57 r roc

1

Warum wird die Quadratwurzeltransformation für Zählungsdaten empfohlen?

Es wird oft empfohlen, die Quadratwurzel zu ziehen, wenn Sie Daten zählen. (Beispiele auf CV finden @ HarveyMotulsky Antwort hier oder @ whuber Antwort hier .) Auf der anderen Seite, wenn ein allgemeines lineares Modell mit einer Reaktionsvariable passend als Poisson verteilte, ist das Protokoll der kanonische Link . Dies …

57 generalized-linear-model data-transformation poisson-distribution count-data variance-stabilizing

13

Erhöht 10 Köpfe hintereinander die Wahrscheinlichkeit, dass der nächste Wurf ein Schwanz ist?

Ich gehe davon aus, dass Folgendes zutrifft: Wenn Sie von einer fairen Münze ausgehen und beim Werfen einer Münze 10 Köpfe hintereinander werfen, steigt die Wahrscheinlichkeit, dass die nächste Münze einen Schwanz wirft , nicht, unabhängig von der Wahrscheinlichkeit und / oder dem statistischen Jargon (entschuldigen Sie die Wortspiele). Unter …

57 probability independence intuition games bernoulli-process

7

Beispiele, bei denen die Methode der Momente in kleinen Stichproben die maximale Wahrscheinlichkeit übertrifft?

Maximum Likelihood Estimators (MLE) sind asymptotisch effizient; Wir sehen das praktische Ergebnis darin, dass sie selbst bei kleinen Stichprobengrößen oftmals besser abschätzen als die Momentenmethode (MoM) (wenn sie sich unterscheiden) Hier bedeutet "besser als" in dem Sinne, dass typischerweise eine geringere Varianz vorliegt, wenn beide unverzerrt sind, und typischerweise ein …

57 estimation maximum-likelihood mse method-of-moments efficiency

4

Was ist der Grund, warum eine Likelihood-Funktion kein PDF ist?

Was ist der Grund, warum eine Wahrscheinlichkeitsfunktion kein PDF ist (Wahrscheinlichkeitsdichtefunktion)?

57 likelihood pdf

4

Ist es sinnvoll, einem Modell einen quadratischen, nicht aber einen linearen Term hinzuzufügen?

Ich habe ein (gemischtes) Modell, in dem einer meiner Prädiktoren (aufgrund der experimentellen Manipulation) von vornherein nur quadratisch mit dem Prädiktor in Beziehung stehen sollte. Daher möchte ich dem Modell nur den quadratischen Term hinzufügen. Zwei Dinge hindern mich daran: Ich glaube, ich habe irgendwo gelesen, dass Sie beim Anpassen …

57 regression polynomial

17

Maschinelles Lernen Kochbuch / Referenzkarte / Spickzettel?

Ich finde Ressourcen wie das Probability and Statistics Cookbook und die R Reference Card für Data Mining unglaublich nützlich. Sie dienen offensichtlich als Referenzen, helfen mir aber auch, meine Gedanken zu einem Thema zu ordnen und die Lage des Landes zu bestimmen. F: Gibt es solche Ressourcen für Methoden des …

57 machine-learning references

5

Wie klein sollte eine Menge zu x addiert werden, um zu vermeiden, dass das Protokoll Null wird?

Ich habe meine Daten so analysiert, wie sie sind. Jetzt möchte ich meine Analysen betrachten, nachdem ich alle Variablen protokolliert habe. Viele Variablen enthalten viele Nullen. Aus diesem Grund füge ich eine kleine Menge hinzu, um zu vermeiden, dass das Protokoll Null wird. Bisher habe ich 10 ^ -10 hinzugefügt, …

57 data-transformation chemometrics