Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren


2
Praktische Fragen zur Optimierung von Random Forests
Meine Fragen beziehen sich auf zufällige Wälder. Das Konzept dieses schönen Klassifikators ist mir klar, aber es gibt noch viele praktische Fragen zur Verwendung. Leider konnte ich keinen praktischen Leitfaden für RF finden (ich habe nach etwas wie "Ein praktischer Leitfaden für das Training eingeschränkter Boltzman-Maschinen" von Geoffrey Hinton gesucht, …

4
Was ist der Unterschied zwischen einer "Linkfunktion" und einer "kanonischen Linkfunktion" für GLM?
Was ist der Unterschied zwischen den Begriffen "Link-Funktion" und "Canonical Link-Funktion"? Gibt es auch irgendwelche (theoretischen) Vorteile, wenn man eins gegenüber dem anderen verwendet? Beispielsweise kann eine binäre Antwortvariable unter Verwendung vieler Verknüpfungsfunktionen wie logit , probit usw. modelliert werden. Logit wird hier jedoch als die "kanonische" Verknüpfungsfunktion betrachtet.


18
Fragen zum Statistik-Interview
Ich suche nach statistischen Fragen (und wahrscheinlich auch nach Interviewfragen), von den grundlegendsten bis zu den fortgeschritteneren. Antworten sind nicht erforderlich (obwohl Links zu bestimmten Fragen auf dieser Website gut tun würden).


5
Welche Verlustfunktion für Klassifizierungsaufgaben mit mehreren Klassen und mehreren Markierungen in neuronalen Netzen?
Ich trainiere ein neuronales Netzwerk, um eine Menge von Objekten in n-Klassen zu klassifizieren. Jedes Objekt kann gleichzeitig mehreren Klassen angehören (Multi-Class, Multi-Label). Ich habe gelesen, dass bei Problemen mit mehreren Klassen generell empfohlen wird, anstelle von mse Softmax und kategoriale Kreuzentropie als Verlustfunktion zu verwenden, und ich verstehe mehr …


8
Ist die R-Sprache für das Gebiet der Ökonomie zuverlässig?
Ich bin ein Doktorand der Wirtschaftswissenschaften, der kürzlich von anderen sehr bekannten statistischen Paketen auf R umgestellt hat (ich habe hauptsächlich SPSS verwendet). Mein kleines Problem im Moment ist, dass ich der einzige R-User in meiner Klasse bin. Meine Klassenkameraden benutzen Stata und Gauss und einer meiner Professoren sagte sogar, …

5
Einheitliche Sicht auf die Schrumpfung: Welche Beziehung besteht (wenn überhaupt) zwischen Steins Paradoxon, Gratregression und zufälligen Effekten in gemischten Modellen?
Betrachten Sie die folgenden drei Phänomene. Steins Paradoxon: Angesichts einiger Daten aus der multivariaten Normalverteilung in ist der Stichprobenmittelwert kein sehr guter Schätzer für den wahren Mittelwert. Man kann eine Schätzung mit kleinerem mittleren Fehlerquadrat erhalten, wenn man alle Koordinaten des Stichprobenmittelwerts gegen Null schrumpft [oder gegen ihren Mittelwert oder …

8
Was ist ein gutes, überzeugendes Beispiel, bei dem p-Werte nützlich sind?
Meine Frage im Titel ist selbsterklärend, aber ich möchte ihr einen Kontext geben. Die ASA veröffentlichte Anfang dieser Woche eine Erklärung „ zu p-Werten: Kontext, Prozess und Zweck “, in der verschiedene häufig vorkommende Missverständnisse des p-Werts umrissen und zur Vorsicht gedrängt wurden, ihn nicht ohne Kontext und Gedanken zu …


1
Wie interpretiere ich Koeffizienten in einer Poisson-Regression?
Wie kann ich die Haupteffekte (Koeffizienten für Dummy-codierten Faktor) in einer Poisson-Regression interpretieren? Nehmen wir das folgende Beispiel an: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), levels = c(1, …


1
Indexnotation in Erwartungen
Welche genaue Bedeutung hat die tiefgestellte Notation bei bedingten Erwartungen im Rahmen der Maßtheorie? Diese Indizes erscheinen nicht in der Definition der bedingten Erwartung, aber wir können sie zum Beispiel auf dieser Seite von Wikipedia sehen . (Beachten Sie, dass dies nicht immer der Fall war, auf derselben Seite vor …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.