Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren



1
Wie kann man bestimmen, ob die y-Achse eines Graphen bei Null beginnen soll oder nicht?
Eine gebräuchliche Methode, um "mit Daten zu lügen", ist die Verwendung einer Y-Achsen-Skala, die den Anschein erweckt, als wären Änderungen bedeutsamer als sie tatsächlich sind. Wenn ich wissenschaftliche Veröffentlichungen oder Laborberichte von Studenten überprüfe, bin ich oft frustriert über diese "Sünde der Datenvisualisierung" (die meines Erachtens unbeabsichtigt begangen wird, aber …



10
So zeichnen Sie Trends richtig
Ich erstelle eine Grafik, um die Trends der Sterblichkeitsraten (pro 1000 Einwohner) in verschiedenen Ländern darzustellen, und die Geschichte, die sich aus der Handlung ergeben sollte, ist, dass Deutschland (hellblaue Linie) der einzige ist, dessen Trend nach 1932 zunimmt. Dies ist Mein erster (einfacher) Versuch Meiner Meinung nach zeigt dieses …

2
Wie werden künstliche Daten für die logistische Regression simuliert?
Ich weiß, dass ich etwas in meinem Verständnis der logistischen Regression vermisse und würde mich über jede Hilfe sehr freuen. Nach meinem Verständnis geht die logistische Regression davon aus, dass die Wahrscheinlichkeit eines 1-Ergebnisses bei den Eingaben eine lineare Kombination der Eingaben ist, die durch eine inverse logistische Funktion geleitet …


8
Gibt es einen Goldstandard für die Modellierung von Zeitreihen mit unregelmäßigen Abständen?
Im Bereich der Ökonomie (glaube ich) gibt es ARIMA und GARCH für regelmäßig verteilte Zeitreihen und Poisson, Hawkes für die Modellierung von Punktprozessen. Wie wäre es also mit Versuchen, unregelmäßig (ungleichmäßig) verteilte Zeitreihen zu modellieren - gibt es (zumindest) gängige Vorgehensweisen ? (Wenn Sie etwas über dieses Thema wissen, können …

5
R online nutzen - ohne es zu installieren [closed]
Gibt es eine Möglichkeit, R in einem Webinterface zu verwenden, ohne es installieren zu müssen? Ich habe nur ein kleines Skript, das ich gerne ausführe, aber ich möchte es nur ohne langen Installationsvorgang ausprobieren. Danke.
45 r 

3
Was ist Abweichung? (speziell im WARENKORB / Teil)
Was ist "Abweichung", wie wird sie berechnet und wie werden sie in verschiedenen Bereichen der Statistik verwendet? Insbesondere interessiere ich mich persönlich für die Verwendung in CART (und die Implementierung in rpart in R). Ich frage dies, da der Wiki-Artikel etwas zu wünschen übrig lässt und Ihre Einsichten sehr willkommen …
45 r  cart  rpart  deviance 

15
Erwartete Anzahl von Verhältnissen zwischen Mädchen und Jungen
Beim Eignungstest für Vorstellungsgespräche für kritisches Denken bin ich auf eine Frage gestoßen. Es geht ungefähr so: Die Republik Zorganian hat einige sehr merkwürdige Bräuche. Paare wünschen sich nur weibliche Kinder, da nur weibliche das Vermögen der Familie erben können. Wenn sie also ein männliches Kind haben, bekommen sie so …



4
Normalisierung vs. Skalierung
Was ist der Unterschied zwischen Daten "Normalisierung" und Daten "Skalierung"? Bis jetzt dachte ich, beide Begriffe beziehen sich auf denselben Prozess, aber jetzt stelle ich fest, dass es noch etwas gibt, das ich nicht kenne / verstehe. Auch wenn es einen Unterschied zwischen Normalisierung und Skalierung gibt, wann sollten wir …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.