Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

2
Multinomiale logistische Regression vs. binäre logistische 1-gegen-Rest-Regression
Nehmen wir an, wir haben eine abhängige Variable mit wenigen Kategorien und einer Menge unabhängiger Variablen. YYY Was sind die Vorteile einer multinomialen logistischen Regression gegenüber einer Reihe von binären logistischen Regressionen (dh einem Ein-gegen-Rest-Schema )? Mit binärer logistischer Regression meine ich, dass wir für jede Kategorie ein separates binäres …

6
Warum macht das „Wegerklären“ intuitiv Sinn?
Ich habe kürzlich ein Prinzip des probabilistischen Denkens kennengelernt, das " Wegerklären " heißt, und ich versuche, eine Intuition dafür zu finden. Lassen Sie mich ein Szenario aufstellen. Sei das Ereignis, bei dem ein Erdbeben auftritt. Lassen Sie Ereignis das Ereignis sein, dass der lustige grüne Riese durch die Stadt …

4
Gute Methoden für Dichtediagramme nicht negativer Variablen in R?
plot(density(rexp(100)) Offensichtlich steht die gesamte Dichte links von Null für eine Verzerrung. Ich möchte einige Daten für Nicht-Statistiker zusammenfassen und Fragen dazu vermeiden, warum nicht-negative Daten eine Dichte links von Null aufweisen. Die Diagramme dienen der Randomisierungsprüfung. Ich möchte die Verteilung der Variablen nach Behandlungs- und Kontrollgruppen aufzeigen. Die Verteilungen …

3
Interpretation des p-Wertes beim Testen von Hypothesen
Ich bin kürzlich auf die Arbeit "The Insignificance of Null Hypothesis Significance Testing" von Jeff Gill (1999) gestoßen . Der Autor brachte einige häufige Missverständnisse in Bezug auf Hypothesentests und p-Werte auf, zu denen ich zwei spezifische Fragen habe: Der p-Wert ist technisch , die, wie erwähnt durch das Papier, …

4
Woher kommt
Eine sehr einfache Version des zentralen begrenzten Theorems wie n−−√((1n∑i=1nXi)−μ) →d N(0,σ2)n((1n∑i=1nXi)−μ) →d N(0,σ2) \sqrt{n}\bigg(\bigg(\frac{1}{n}\sum_{i=1}^n X_i\bigg) - \mu\bigg)\ \xrightarrow{d}\ \mathcal{N}(0,\;\sigma^2) ist Lindeberg-Lévy CLT. Ich verstehe nicht, warum es einn−−√n\sqrt{n} auf der linken Seite. Und Lyapunov CLT sagt 1sn∑i=1n(Xi−μi) →d N(0,1)1sn∑i=1n(Xi−μi) →d N(0,1) \frac{1}{s_n} \sum_{i=1}^{n} (X_i - \mu_i) \ \xrightarrow{d}\ \mathcal{N}(0,\;1) …






5
Maßnahme im Data Mining aufheben
Ich habe viele Websites durchsucht, um zu wissen, was Lift genau bewirkt. Die Ergebnisse, die ich gefunden habe, handelten von der Verwendung in Anwendungen, die sich nicht von selbst unterscheiden. Ich kenne die Unterstützungs- und Vertrauensfunktion. Laut Wikipedia ist Lift beim Data Mining ein Maß für die Leistung eines Modells …


5
Zeitfunktionen in R [geschlossen]
Ich möchte die Zeit messen, die benötigt wird, um die Ausführung einer Funktion zu wiederholen. Sind replicate()und benutzen for-Schleifen gleichwertig? Beispielsweise: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Welches ist die bevorzugte Methode. In der Ausgabe von system.time(), ist sys+userdie tatsächliche CPU - Zeit , um das Programm zum Laufen? Ist elapsedein …
36 r 

8
Unter welchen Bedingungen sollte man eine mehrstufige / hierarchische Analyse verwenden?
Unter welchen Bedingungen sollte jemand in Betracht ziehen, eine mehrstufige / hierarchische Analyse anstelle einer grundlegenderen / traditionelleren Analyse (z. B. ANOVA, OLS-Regression usw.) zu verwenden? Gibt es Situationen, in denen dies als obligatorisch angesehen werden könnte? Gibt es Situationen, in denen die Verwendung einer mehrstufigen / hierarchischen Analyse ungeeignet …

10
Was ist die Erklärung Ihres Lieblingslaien für ein schwieriges statistisches Konzept?
Ich höre sehr gerne einfache Erklärungen zu komplexen Problemen. Was ist Ihre Lieblingsanalogie oder Anekdote, die ein schwieriges statistisches Konzept erklärt? Mein Favorit ist Murrays Erklärung für die Integration mit einem Betrunkenen und ihrem Hund. Murray erklärt, wie zwei zufällige Prozesse (ein wandernder Betrunkener und ihr Hund Oliver) Einheitswurzeln haben …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.