Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

16
Welche missbräuchlichen statistischen Begriffe sind zu korrigieren?
Statistik ist überall; Die gebräuchliche Verwendung statistischer Begriffe ist jedoch häufig unklar. Die Begriffe Wahrscheinlichkeit und Gewinnchancen werden trotz ihrer gut definierten und unterschiedlichen mathematischen Ausdrücke im Laien-Englisch austauschbar verwendet. Wenn man den Begriff Wahrscheinlichkeit nicht von der Wahrscheinlichkeit trennt, verwirrt dies Ärzte routinemäßig, die versuchen, die Wahrscheinlichkeit von Brustkrebs …
103 terminology 

19
Wie ärgert man einen statistischen Schiedsrichter?
Ich habe kürzlich eine Frage zu allgemeinen Grundsätzen für die Überprüfung von Statistiken in Veröffentlichungen gestellt . Was ich jetzt fragen möchte, ist, was Sie beim Überprüfen einer Arbeit besonders irritiert, dh was ist der beste Weg, um einen statistischen Schiedsrichter wirklich zu ärgern! Ein Beispiel pro Antwort, bitte.


2
Die Entfernung des statistisch signifikanten Intercept-Terms erhöht im linearen Modell
In einem einfachen linearen Modell mit einer einzelnen erklärenden Variablen αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Ich finde, dass das Entfernen des Intercept-Terms die Anpassung stark verbessert (der Wert von geht von 0,3 auf 0,9). Der Intercept-Term scheint jedoch statistisch signifikant zu sein.R2R2R^2 Mit abfangen: Call: lm(formula = …

3
Batch-Gefälle versus stochastisches Gefälle
Angenommen, wir haben eine Trainingsmenge ( x( i ), y( i ))(x(i),y(i))(x_{(i)}, y_{(i)}) für i = 1 , ... , mi=1,…,mi = 1, \dots, m . Angenommen, wir führen eine Art von überwachtem Lernalgorithmus für den Trainingssatz aus. Hypothesen werden dargestellt als hθ( x( i )) = θ0+ θ1X( i …

8
ASA diskutiert Einschränkungen von
Wir haben bereits mehrere Threads als p-Werte markiert , die viele Missverständnisse über sie aufdecken. Vor zehn Monaten hatten wir einen Thread über ein psychologisches Journal, das ppp Werte "verbot" . Jetzt sagt die American Statistical Association (2016) , dass wir mit unserer Analyse "nicht mit der Berechnung eines Werts …



25
Auffinden frei verfügbarer Datenproben
Ich habe an einer neuen Methode zum Analysieren und Analysieren von Datensätzen gearbeitet, um Untergruppen einer Population zu identifizieren und zu isolieren, ohne vorher die Merkmale einer Untergruppe zu kennen. Während die Methode mit Stichproben künstlicher Daten (dh Datensätzen, die speziell zum Identifizieren und Trennen von Teilmengen der Bevölkerung erstellt …





3
Intuitive Erklärung der Einheitswurzel
Wie würden Sie im Rahmen des Unit-Root-Tests intuitiv erklären, was eine Unit-Root ist? Ich denke in einer Art zu erklären, wie ich sie in dieser Frage begründet habe . Der Fall mit Unit Root ist, dass ich (im Übrigen wenig) weiß, dass der Unit Root-Test zum Testen der Stationarität in …

4
Wie kann man intuitiv erklären, was ein Kernel ist?
Bei vielen maschinellen Lernklassifikatoren (z. B. Support-Vektor-Maschinen) kann ein Kernel angegeben werden. Was wäre eine intuitive Art zu erklären, was ein Kernel ist? Ein Aspekt, über den ich nachgedacht habe, ist die Unterscheidung zwischen linearen und nichtlinearen Kerneln. In einfachen Worten könnte ich von "linearen Entscheidungsfunktionen" und "nichtlinearen Entscheidungsfunktionen" sprechen. …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.