Situationen, in denen eine Ebene einer kategorialen Variablen sehr selten auftritt (z. B. eine seltene Krankheit). Dies kann insbesondere dann ein Problem sein, wenn die Variable die Antwortvariable in einem Modell ist.
Talebs Buch "The Black Swan" war ein Bestseller der New York Times, als es vor einigen Jahren herauskam. Das Buch ist jetzt in der zweiten Auflage. Nach einem Treffen mit Statistikern auf einer JSM (einer jährlichen statistischen Konferenz) hat Taleb seine Kritik an der Statistik etwas abgeschwächt. Der Kern des …
Ich möchte seltene Ereignisse in einer endlichen Population untersuchen. Da ich nicht sicher bin, welche Strategie am besten geeignet ist, würde ich mich über Tipps und Hinweise in Bezug auf diese Angelegenheit freuen, obwohl ich mir bewusst bin, dass sie weitgehend abgedeckt wurde. Ich weiß nur nicht wirklich, wo ich …
CrossValidated hat verschiedene Fragen, wann und wie die Selten-Ereignis-Bias-Korrektur von King und Zeng (2001) angewendet werden soll. . Ich suche etwas anderes: eine minimale simulationsbasierte Demonstration, dass der Bias existiert. Insbesondere König und Zeng Zustand "... in Daten zu seltenen Ereignissen können die Wahrscheinlichkeiten bei Stichprobengrößen zu Tausenden erheblich sein …
Ich versuche, den Gradienten für ein Dataset mit einer Ereignisrate von etwa 1% mithilfe von Enterprise Miner zu erhöhen, aber es wird keine Ausgabe erzeugt. Meine Frage ist, ob es sich um einen auf Entscheidungsbäumen basierenden Ansatz handelt, ob es überhaupt richtig ist, die Gradientenverstärkung bei einem so niedrigen Ereignis …
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
Neulich habe ich mich mit einem Epidemiologen beraten lassen. Sie ist Ärztin mit einem Abschluss in Epidemiologie im Gesundheitswesen und verfügt über umfangreiche statistische Kenntnisse. Sie betreut ihre Forschungsstipendiaten und Bewohner und hilft ihnen bei statistischen Fragen. Sie versteht Hypothesentests ziemlich gut. Sie hatte das typische Problem, zwei Gruppen zu …
Nehmen Sie die folgende eindimensionale Sequenz an: A, B, C, Z, B, B, #, C, C, C, V, $, W, A, % ... Buchstaben A, B, C, ..hier repräsentieren "gewöhnliche" Ereignisse. Symbole stehen #, $, %, ...hier für "besondere" Ereignisse Der zeitliche Abstand zwischen allen Ereignissen ist ungleichmäßig (von Sekunden …
Ich weiß, dass die Stichprobengröße die Leistung bei jeder statistischen Methode beeinflusst. Es gibt Faustregeln für die Anzahl der Stichproben, die eine Regression für jeden Prädiktor benötigt. Ich höre auch oft, dass die Anzahl der Stichproben in jeder Kategorie in der abhängigen Variablen einer logistischen Regression wichtig ist. Warum ist …
Angenommen, in einer Regressionsanalyse in R habe ich eine faktortypunabhängige Variable mit 3 Ebenen in meinem Zugdatensatz. Im Testdatensatz hat dieselbe Faktorvariable jedoch 5 Ebenen. Daher kann ich die Antwortwerte für den Testdatensatz nicht vorhersagen. Was ist in diesem Fall zu tun?
Ich habe einen Datensatz mit einer binären (Überlebens-) Antwortvariablen und 3 erklärenden Variablen ( A= 3 Ebenen, B= 3 Ebenen, C= 6 Ebenen). In diesem Datensatz sind die Daten mit 100 Personen pro ABCKategorie ausgewogen . Ich studierte bereits die Wirkung von diesen A, Bund CVariablen , die mit diesem …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.