Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

3
Empfehlung für eine begutachtete Open-Source-Zeitschrift?
Ich habe ein Manuskript über eine Bootstrap-Methode zum Testen von Hypothesen von einem Mittelwert, und ich möchte es zur Veröffentlichung senden, aber ich habe ein moralisches Dilemma. Ich habe mich dem Protest gegen Elsevier wegen ihrer unethischen Geschäftspraktiken angeschlossen, und das Nachlesen des gesamten Themas hat mich wirklich dazu veranlasst, …



4
Optimierung für Precision-Recall-Kurven bei Klassenungleichgewicht
Ich habe eine Klassifizierungsaufgabe mit einer Reihe von Prädiktoren (von denen einer der informativste ist), und ich verwende das MARS- Modell, um meinen Klassifizierer zu konstruieren (ich interessiere mich für ein einfaches Modell und würde glms zur Veranschaulichung verwenden) auch gut). Jetzt habe ich ein großes Klassenungleichgewicht in den Trainingsdaten …




3
Visualisierung der Schnittpunkte vieler Mengen
Gibt es ein Visualisierungsmodell, mit dem die Überschneidung vieler Mengen dargestellt werden kann? Ich denke etwas wie Venn-Diagramme, aber das könnte sich irgendwie besser für eine größere Anzahl von Sätzen wie 10 oder mehr eignen. Wikipedia zeigt einige höher eingestellte Venn-Diagramme, aber auch die 4 eingestellten Diagramme sind sehr viel …

6
Wann sind Konfidenzintervalle sinnvoll?
Wenn ich richtig verstehe, ist ein Konfidenzintervall eines Parameters ein Intervall, das mit einer Methode erstellt wurde, die Intervalle liefert, die den wahren Wert für einen bestimmten Anteil von Stichproben enthalten. Das "Vertrauen" bezieht sich also eher auf die Methode als auf das Intervall, das ich aus einer bestimmten Stichprobe …



8
Welche Theorien sollte jeder Statistiker kennen?
Ich denke darüber aus einer sehr einfachen Perspektive mit minimalen Anforderungen nach. Was sind die wichtigsten Theorien, die ein (nicht akademischer) Statistiker in der Branche regelmäßig kennen, verstehen und anwenden sollte? Ein großer Gedanke ist das Gesetz der großen Zahlen . Was ist für die Anwendung der statistischen Theorie auf …


6
Schätzung des binomialen Konfidenzintervalls - warum ist es nicht symmetrisch?
Ich habe den folgenden r-Code verwendet, um die Konfidenzintervalle eines Binomialanteils zu schätzen, da ich verstehe, dass dies eine "Leistungsberechnung" ersetzt, wenn Empfänger-Betriebskennliniendesigns entworfen werden, bei denen die Erkennung von Krankheiten in einer Population untersucht wird. n ist 150, und wir glauben, dass die Krankheit in der Bevölkerung zu 25% …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.