Statistiken und Big Data

1

Negative binomische Regressionsfrage - ist es ein schlechtes Modell?

Ich lese einen sehr interessanten Artikel von Sellers und Shmueli über Regressionsmodelle für Zähldaten. Am Anfang (S. 944) wird auf McCullaugh und Nelder (1989) verwiesen , wonach eine negative binomische Regression unpopulär ist und einen problematischen kanonischen Zusammenhang aufweist. Ich habe die betreffende Passage gefunden und sie lautet (S. 374 …

31 regression modeling negative-binomial

2

Was ist der Unterschied zwischen „Deep Learning“ und mehrstufiger / hierarchischer Modellierung?

Ist "Deep Learning" nur ein weiterer Begriff für mehrstufige / hierarchische Modellierung? Ich kenne die letztere viel besser als die erstere, aber soweit ich das beurteilen kann, besteht der Hauptunterschied nicht in ihrer Definition, sondern darin, wie sie in ihrem Anwendungsbereich verwendet und bewertet werden. Es sieht so aus, als …

31 machine-learning multilevel-analysis hierarchical-bayesian deep-learning

5

Empfehlungen zu Farbe und Liniendicke für Liniendiagramme

Es wurde viel über farbenblinde Farbauswahlmöglichkeiten für Karten, Polygone und schattierte Bereiche im Allgemeinen geschrieben (siehe zum Beispiel http://colorbrewer2.org ). Ich konnte keine Empfehlungen für Linienfarben und unterschiedliche Liniendicken für Liniendiagramme finden. Ziele sind: leicht zu unterscheiden Linien, auch wenn sie sich verflechten Linien sind von Personen mit den häufigsten …

31 r data-visualization

4

Warum sprechen niedrigere p-Werte nicht mehr gegen die Null? Argumente von Johansson 2011

Johansson (2011) in „ Hail the unmöglich: p-Wert, Beweise und Wahrscheinlichkeit “ (hier ist auch Link zur Zeitschrift ) besagt , dass untere - Werte oft als stärkere Beweise gegen die Null betrachtet werden. Johansson impliziert, dass die Leute Beweise gegen die Null als stärker ansehen würden, wenn ihr statistischer …

31 hypothesis-testing statistical-significance p-value philosophical

8

Ausreißer durch Mittelwert ersetzen

Diese Frage wurde von meinem Freund gestellt, der nicht mit dem Internet vertraut ist. Ich habe keinen statistischen Hintergrund und habe im Internet nach dieser Frage gesucht. Die Frage ist: Ist es möglich, Ausreißer durch Mittelwerte zu ersetzen? Wenn es möglich ist, gibt es Buchreferenzen / Zeitschriften, um diese Aussage …

31 mean outliers robust winsorizing

1

Was ist der Unterschied zwischen "Bestimmungskoeffizient" und "mittlerer quadratischer Fehler"?

Bei Regressionsproblemen habe ich gesehen, dass Leute "Bestimmungskoeffizienten" (alias R-Quadrat) verwenden, um die Modellauswahl durchzuführen, z. B. um den geeigneten Strafkoeffizienten für die Regularisierung zu finden. Es ist jedoch auch üblich, "mittlere Fehlerquadrat" oder "mittlere Fehlerquadratwurzel" als Maß für die Regressionsgenauigkeit zu verwenden. Was ist der Hauptunterschied zwischen diesen beiden? …

31 regression r-squared

1

PCA-Zielfunktion: Welcher Zusammenhang besteht zwischen Maximierung der Varianz und Minimierung des Fehlers?

Der PCA-Algorithmus kann anhand der Korrelationsmatrix formuliert werden (vorausgesetzt, die Daten bereits normalisiert und es wird nur die Projektion auf den ersten PC in Betracht gezogen). Die Zielfunktion kann wie folgt geschrieben werden:XXX maxw(Xw)T(Xw)s.t.wTw=1.maxw(Xw)T(Xw)s.t.wTw=1. \max_w (Xw)^T(Xw)\; \: \text{s.t.} \: \:w^Tw = 1. Dies ist in Ordnung, und wir verwenden Lagrange-Multiplikatoren, …

31 pca optimization

1

Was sind einige nützliche Richtlinien für GBM-Parameter?

Was sind einige nützliche Richtlinien zum Testen von Parametern (z. B. Interaktionstiefe, Kind, Abtastrate usw.) mit GBM? Nehmen wir an, ich habe 70-100 Features, eine Bevölkerung von 200.000 und ich beabsichtige, die Interaktionstiefe von 3 und 4 zu testen. Natürlich muss ich einige Tests durchführen, um zu sehen, welche Parameterkombination …

31 r hypothesis-testing cart boosting

1

Dimensionsreduktion (SVD oder PCA) auf einer großen, dünn besetzten Matrix

/ edit: Weitere Folgemaßnahmen können jetzt mit irlba :: prcomp_irlba durchgeführt werden / edit: verfolge meinen eigenen Beitrag. irlbaVerfügt nun über die Argumente "center" und "scale", mit denen Sie Hauptkomponenten berechnen können, z. pc <- M %*% irlba(M, nv=5, nu=0, center=colMeans(M), right_only=TRUE)$v Ich habe eine große, spärliche Anzahl Matrixvon Funktionen, …

31 r pca dimensionality-reduction svd matrix-decomposition

5

Ermittlung signifikanter Prädiktoren aus vielen unabhängigen Variablen

In einem Datensatz von zwei nicht überlappenden Populationen (Patienten & Gesunde, insgesamt ) möchte ich (aus unabhängigen Variablen) signifikante Prädiktoren für eine kontinuierliche abhängige Variable finden. Korrelation zwischen Prädiktoren ist vorhanden. Ich bin daran interessiert herauszufinden, ob einer der Prädiktoren "in der Realität" mit der abhängigen Variablen zusammenhängt (anstatt die …

31 regression pca feature-selection stepwise-regression underdetermined

3

Entropiebasierte Widerlegung von Shalizis Bayes'schem Rückwärtspfeil des Zeitparadoxons?

In dieser Arbeit argumentiert der talentierte Forscher Cosma Shalizi, dass man, um eine subjektive Bayes'sche Sichtweise vollständig zu akzeptieren, auch ein unphysisches Ergebnis akzeptieren muss, dass der Zeitpfeil (gegeben durch den Fluss der Entropie) tatsächlich rückwärts gehen sollte . Dies ist hauptsächlich ein Versuch, gegen die maximale Entropie / vollständig …

31 bayesian entropy maximum-entropy philosophical

4

Analyse mit komplexen Daten, etwas anderes?

Angenommen, Sie erstellen ein lineares Modell, aber die Daten sind komplex.yyy y=xβ+ϵy=xβ+ϵ y = x \beta + \epsilon Mein Datensatz ist komplex, da alle Zahlen in die Form . Gibt es verfahrenstechnische Unterschiede bei der Arbeit mit solchen Daten?yyy(a+bi)(a+bi)(a + bi) Ich frage, weil Sie am Ende komplexe Kovarianzmatrizen und …

31 regression anova data-transformation complex-numbers

3

Warum ist eine Variablenauswahl notwendig?

Gängige datenbasierte Variablenauswahlverfahren (z. B. vorwärts, rückwärts, schrittweise, alle Teilmengen) führen tendenziell zu Modellen mit unerwünschten Eigenschaften, darunter: Koeffizienten von Null weg vorgespannt. Zu kleine Standardfehler und zu enge Konfidenzintervalle. Teststatistiken und p-Werte, die nicht die angegebene Bedeutung haben. Schätzungen der Modellanpassung sind zu optimistisch. Eingeschlossene Begriffe, die bedeutungslos sein …

31 modeling feature-selection

5

Was ist der Unterschied zwischen „Mittelwert“ und „Durchschnitt“?

Wikipedia erklärt: Bei einem Datensatz ist der Mittelwert die Summe der Werte geteilt durch die Anzahl der Werte. Diese Definition entspricht jedoch dem, was ich "Durchschnitt" nenne (zumindest erinnere ich mich daran, dass ich dies gelernt habe). Noch einmal zitiert Wikipedia: Es gibt andere statistische Kennzahlen, die Stichproben verwenden, die …

31 mean interpretation average

2

Wie zeichnet man die Entscheidungsgrenze eines k-Nächsten-Nachbarn-Klassifikators aus Elementen des statistischen Lernens?

Ich möchte die Handlung erzeugen, die im Buch ElemStatLearn "Die Elemente des statistischen Lernens: Data Mining, Inferenz und Vorhersage. Zweite Ausgabe" von Trevor Hastie & Robert Tibshirani & Jerome Friedman beschrieben ist. Die Handlung ist: Ich frage mich, wie ich dieses genaue Diagramm in erzeugen kann. RBeachten Sie insbesondere die …

31 r data-visualization k-nearest-neighbour