Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

6
Ungefähre mit Hilfe von Monte - Carlo - Simulation
Ich habe mir kürzlich die Monte-Carlo-Simulation angesehen und sie verwendet, um Konstanten wie (Kreis in einem Rechteck, proportionale Fläche) anzunähern.ππ\pi Ich kann mir jedoch keine entsprechende Methode vorstellen, um den Wert von [Eulers Zahl] mithilfe der Monte-Carlo-Integration zu approximieren .eee Haben Sie Hinweise, wie dies getan werden kann?

6
Beste Methode für kurze Zeitreihen
Ich habe eine Frage zur Modellierung kurzer Zeitreihen. Es ist keine Frage, ob man sie modelliert , sondern wie. Welche Methode empfehlen Sie für die Modellierung (sehr) kurzer Zeitreihen (etwa der Länge T≤20T≤20T \leq 20 )? Mit "am besten" meine ich hier die robusteste, die aufgrund der begrenzten Anzahl von …

2
Multiple Regression oder partieller Korrelationskoeffizient? Und die Beziehungen zwischen den beiden
Ich weiß nicht einmal, ob diese Frage sinnvoll ist, aber was ist der Unterschied zwischen multipler Regression und partieller Korrelation (abgesehen von den offensichtlichen Unterschieden zwischen Korrelation und Regression, die ich nicht anstrebe)? Ich möchte Folgendes herausfinden: Ich habe zwei unabhängige Variablen ( x1x1x_1 , ) und eine abhängige Variable …

5
Wie löst man Simpsons Paradoxon?
Simpsons Paradoxon ist ein klassisches Rätsel, das in einführenden Statistikkursen weltweit behandelt wird. In meinem Kurs ging es jedoch nur darum, festzustellen, dass ein Problem bestand und keine Lösung lieferte. Ich würde gerne wissen, wie man das Paradoxon löst. Das heißt, wenn man mit einem Simpson-Paradoxon konfrontiert wird, bei dem …

3
Wie werden OOB und Verwirrungsmatrix für zufällige Gesamtstrukturen interpretiert?
Ich habe von jemandem ein R-Skript zum Ausführen eines zufälligen Gesamtstrukturmodells erhalten. Ich habe es geändert und mit einigen Mitarbeiterdaten ausgeführt. Wir versuchen, freiwillige Trennungen vorherzusagen. Hier einige zusätzliche Informationen: Dies ist ein Klassifizierungsmodell, bei dem 0 = Mitarbeiter verblieben, 1 = Mitarbeiter gekündigt wurde. Wir sehen uns derzeit nur …

2
Was ist zusammengesetzte Symmetrie in einfachem Englisch?
Kürzlich wurde mir klar, dass ein gemischtes Modell mit nur einem Subjekt als Zufallsfaktor und den anderen Faktoren als festen Faktoren einer ANOVA entspricht, wenn die Korrelationsstruktur des gemischten Modells auf zusammengesetzte Symmetrie eingestellt wird. Daher möchte ich wissen, was Verbindungssymmetrie im Kontext einer gemischten (dh aufgeteilten) ANOVA bedeutet, bestenfalls …


7
Auswählen von Variablen, die in ein Modell mit mehreren linearen Regressionen aufgenommen werden sollen
Ich arbeite derzeit daran, ein Modell mit einer multiplen linearen Regression zu erstellen. Nachdem ich mit meinem Modell herumgespielt habe, bin ich mir nicht sicher, wie ich am besten bestimmen kann, welche Variablen aufbewahrt und welche entfernt werden sollen. Mein Modell startete mit 10 Prädiktoren für den DV. Bei Verwendung …


4
Begründung eines einseitigen Hypothesentests
Ich verstehe zweiseitige Hypothesentests. Sie haben H0:θ=θ0H0:θ=θ0H_0 : \theta = \theta_0 (vs. ). Der Wert ist die Wahrscheinlichkeit, dass Daten erzeugt, die mindestens so extrem sind wie die beobachteten. p θH1=¬H0:θ≠θ0H1=¬H0:θ≠θ0H_1 = \neg H_0 : \theta \ne \theta_0pppθθ\theta Ich verstehe keine einseitigen Hypothesentests. Hier ist (vs. ). Die Definition des …

5
Was ist eine gute Verwendung der 'Kommentar'-Funktion in R?
Ich habe gerade die commentFunktion in R entdeckt. Beispiel: x <- matrix(1:12, 3,4) comment(x) <- c("This is my very important data from experiment #0234", "Jun 5, 1998") x comment(x) Dies ist das erste Mal, dass ich diese Funktion besuche und mich frage, welche häufigen / nützlichen Verwendungen es gibt. Da …
35 r 



2
Der Beweis für die vom Menschen verursachte globale Erwärmung entspricht dem „Goldstandard“: Wie haben sie das gemacht?
Diese Nachricht in einem Reuter-Artikel vom 25.02.2019 ist derzeit in allen Nachrichten enthalten: Beweis für vom Menschen verursachte globale Erwärmung erreicht "Goldstandard" [Wissenschaftler] gaben an, die Zuversicht, dass menschliche Aktivitäten die Hitze an der Erdoberfläche ansteigen ließen, habe ein Fünf-Sigma-Niveau erreicht. Ein statistisches Maß bedeutet, dass das Signal nur mit …

5
Warum verringert das Erhöhen der Stichprobengröße die (Stichproben-) Varianz?
Großes Bild: Ich versuche zu verstehen, wie das Erhöhen der Stichprobengröße die Leistung eines Experiments erhöht. Die Folien meines Dozenten erläutern dies mit einem Bild von 2 Normalverteilungen, eine für die Nullhypothese und eine für die Alternativhypothese und einer Entscheidungsschwelle c dazwischen. Sie argumentieren, dass eine zunehmende Stichprobengröße die Varianz …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.