Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren



1
Gibt es eine Faktoranalyse oder eine PCA für ordinale oder binäre Daten?
Ich habe die Hauptkomponentenanalyse (PCA), Exploratory Factor Analysis (EFA) und Confirmatory Factor Analysis (CFA) abgeschlossen und Daten mit einer Likert-Skala (5-Level-Antworten: keine, ein wenig, einige, ..) als kontinuierlich behandelt Variable. Dann wiederholte ich mit Lavaan den CFA, indem ich die Variablen als kategorial definierte. Ich würde gerne wissen, welche Arten …

1
Wie falsch ist ein Regressionsmodell, wenn die Annahmen nicht erfüllt sind?
Was passiert beim Anpassen eines Regressionsmodells, wenn die Annahmen der Ausgaben nicht erfüllt werden? Was passiert, wenn die Residuen nicht homoskedastisch sind? Wenn die Residuen ein zunehmendes oder abnehmendes Muster im Diagramm Residuen vs. Was passiert, wenn die Residuen nicht normal verteilt sind und den Shapiro-Wilk-Test nicht bestehen? Der Shapiro-Wilk-Test …

3
Was ist eine Mannigfaltigkeit?
In Dimensionalitätsreduktionstechniken wie Hauptkomponentenanalyse, LDA usw. wird häufig der Begriff Mannigfaltigkeit verwendet. Was ist eine Mannigfaltigkeit in nicht-technischer Hinsicht? Wenn ein Punkt zu einer Kugel gehört, deren Abmessung ich reduzieren möchte, und wenn es ein Rauschen gibt, und und nicht korreliert sind, dann würden die tatsächlichen Punkte aufgrund des Rauschens …



2
Warum geschichtete Kreuzvalidierung verwenden? Warum schadet dies nicht der Varianz?
Mir wurde gesagt, dass es von Vorteil ist, eine geschichtete Kreuzvalidierung zu verwenden, insbesondere wenn die Antwortklassen nicht ausgeglichen sind. Wenn ein Zweck der Kreuzvalidierung darin besteht, die Zufälligkeit unserer ursprünglichen Trainingsdatenstichprobe zu berücksichtigen, würde es sicher dagegen wirken, wenn Sie für jede Falte die gleiche Klassenverteilung festlegen, es sei …

2
Warum sind p-Werte nach einer schrittweisen Auswahl irreführend?
Betrachten wir zum Beispiel ein lineares Regressionsmodell. Ich habe gehört, dass es beim Data Mining nach einer schrittweisen Auswahl auf der Grundlage des AIC-Kriteriums irreführend ist, die p-Werte zu betrachten, um die Nullhypothese zu testen, dass jeder wahre Regressionskoeffizient Null ist. Ich habe gehört, dass man alle Variablen, die im …

2
Weißes Rauschen in der Statistik
Ich sehe oft den Begriff weißes Rauschen, wenn ich über verschiedene statistische Modelle lese. Ich muss jedoch zugeben, dass ich nicht ganz sicher bin, was das bedeutet. Es wird normalerweise als abgekürzt . Bedeutet das, dass es normal verteilt ist, oder könnte es irgendeiner Verteilung folgen?WN( 0 , σ2)WN(0,σ2)WN(0,σ^2)






Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.