Fazit : Je mehr ich über Statistik lerne, desto weniger vertraue ich veröffentlichten Artikeln in meinem Bereich. Ich glaube einfach, dass Forscher ihre Statistiken nicht gut genug machen. Ich bin sozusagen ein Laie. Ich bin in Biologie ausgebildet, aber ich habe keine formale Ausbildung in Statistik oder Mathematik. Ich mag …
Wie kann ein Regressionsmodell von Nutzen sein, wenn Sie die Funktion nicht kennen, für die Sie die Parameter abrufen möchten? Ich habe eine Studie gesehen, aus der hervorgeht, dass Mütter, die ihre Kinder gestillt haben, im späteren Leben mit geringerer Wahrscheinlichkeit an Diabetes leiden. Die Untersuchung wurde aus einer Umfrage …
Diese Frage beschäftigt mich seit über einem Monat. In der Ausgabe der Amstat News vom Februar 2015 ist ein Artikel von Berkeley-Professor Mark van der Laan zu lesen, in dem die Leute wegen der Verwendung ungenauer Modelle beschimpft werden. Er stellt fest, dass Statistik durch die Verwendung von Modellen eher …
Ich habe mich gefragt, ob es ein statistisches Modell für "Spickzettel" gibt, das eine oder mehrere Informationen enthält: Wann ist das Modell anzuwenden? wenn Sie das Modell nicht benutzen Erforderliche und optionale Eingaben erwartete Ergebnisse Wurde das Modell in verschiedenen Bereichen (Politik, Bio, Technik, Fertigung usw.) getestet? Wird es in …
Ich habe versucht, meine Daten in verschiedene Modelle einzufügen, und dabei herausgefunden, dass die fitdistrFunktion aus der Bibliothek MASSvon Rmir Negative Binomialdie beste Anpassung ergibt . Auf der Wiki- Seite lautet die Definition nun: Die NegBin (r, p) -Verteilung beschreibt die Wahrscheinlichkeit von k Fehlern und r Erfolgen in k …
Ich arbeite derzeit daran, ein Modell mit einer multiplen linearen Regression zu erstellen. Nachdem ich mit meinem Modell herumgespielt habe, bin ich mir nicht sicher, wie ich am besten bestimmen kann, welche Variablen aufbewahrt und welche entfernt werden sollen. Mein Modell startete mit 10 Prädiktoren für den DV. Bei Verwendung …
Abgesehen vom buchstäblichen Testen jeder möglichen Kombination von Variablen in einem Modell ( x1:x2oder x1*x2 ... xn-1 * xn). Wie erkennen Sie, ob eine Interaktion zwischen Ihren unabhängigen (hoffentlich) Variablen bestehen SOLLTE oder KÖNNTE? Was sind Best Practices für den Versuch, Interaktionen zu identifizieren? Gibt es eine grafische Technik, die …
Ich habe vier verschiedene Zeitreihen von Stundenmessungen: Der Wärmeverbrauch in einem Haus Die Temperatur außerhalb des Hauses Die Sonnenstrahlung Die Windgeschwindigkeit Ich möchte den Wärmeverbrauch im Haus vorhersagen können. Es gibt einen klaren saisonalen Trend, sowohl auf jährlicher Basis als auch auf täglicher Basis. Da es eine eindeutige Korrelation zwischen …
Ich lese einen sehr interessanten Artikel von Sellers und Shmueli über Regressionsmodelle für Zähldaten. Am Anfang (S. 944) wird auf McCullaugh und Nelder (1989) verwiesen , wonach eine negative binomische Regression unpopulär ist und einen problematischen kanonischen Zusammenhang aufweist. Ich habe die betreffende Passage gefunden und sie lautet (S. 374 …
Gängige datenbasierte Variablenauswahlverfahren (z. B. vorwärts, rückwärts, schrittweise, alle Teilmengen) führen tendenziell zu Modellen mit unerwünschten Eigenschaften, darunter: Koeffizienten von Null weg vorgespannt. Zu kleine Standardfehler und zu enge Konfidenzintervalle. Teststatistiken und p-Werte, die nicht die angegebene Bedeutung haben. Schätzungen der Modellanpassung sind zu optimistisch. Eingeschlossene Begriffe, die bedeutungslos sein …
Ich habe gelernt, dass der erste Schritt beim Umgang mit Daten mithilfe eines modellbasierten Ansatzes die Modellierung von Datenprozeduren als statistisches Modell ist. Der nächste Schritt ist die Entwicklung eines effizienten / schnellen Inferenz- / Lernalgorithmus basierend auf diesem statistischen Modell. Ich möchte also fragen, welches statistische Modell hinter dem …
Was ist der Unterschied zwischen einem Bayes'schen Netzwerk und einem Markov-Prozess? Ich glaubte, die Prinzipien von beiden verstanden zu haben, aber jetzt, wo ich die beiden vergleichen muss, fühle ich mich verloren. Sie bedeuten mir fast dasselbe. Sicher sind sie nicht. Links zu anderen Ressourcen sind ebenfalls willkommen.
Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = …
Ich habe kürzlich einen Kaggle-Wettbewerb abgeschlossen, bei dem der ROC AUC-Score gemäß den Wettbewerbsanforderungen verwendet wurde. Vor diesem Projekt habe ich normalerweise den Wert f1 als Metrik zur Messung der Modellleistung verwendet. In Zukunft frage ich mich, wie ich zwischen diesen beiden Metriken wählen soll. Wann welche verwenden und welche …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.