Nehmen wir an, wir haben eine abhängige Variable mit wenigen Kategorien und einer Menge unabhängiger Variablen. YYY Was sind die Vorteile einer multinomialen logistischen Regression gegenüber einer Reihe von binären logistischen Regressionen (dh einem Ein-gegen-Rest-Schema )? Mit binärer logistischer Regression meine ich, dass wir für jede Kategorie ein separates binäres …
Ich habe kürzlich ein Prinzip des probabilistischen Denkens kennengelernt, das " Wegerklären " heißt, und ich versuche, eine Intuition dafür zu finden. Lassen Sie mich ein Szenario aufstellen. Sei das Ereignis, bei dem ein Erdbeben auftritt. Lassen Sie Ereignis das Ereignis sein, dass der lustige grüne Riese durch die Stadt …
plot(density(rexp(100)) Offensichtlich steht die gesamte Dichte links von Null für eine Verzerrung. Ich möchte einige Daten für Nicht-Statistiker zusammenfassen und Fragen dazu vermeiden, warum nicht-negative Daten eine Dichte links von Null aufweisen. Die Diagramme dienen der Randomisierungsprüfung. Ich möchte die Verteilung der Variablen nach Behandlungs- und Kontrollgruppen aufzeigen. Die Verteilungen …
Ich bin kürzlich auf die Arbeit "The Insignificance of Null Hypothesis Significance Testing" von Jeff Gill (1999) gestoßen . Der Autor brachte einige häufige Missverständnisse in Bezug auf Hypothesentests und p-Werte auf, zu denen ich zwei spezifische Fragen habe: Der p-Wert ist technisch , die, wie erwähnt durch das Papier, …
Eine sehr einfache Version des zentralen begrenzten Theorems wie n−−√((1n∑i=1nXi)−μ) →d N(0,σ2)n((1n∑i=1nXi)−μ) →d N(0,σ2) \sqrt{n}\bigg(\bigg(\frac{1}{n}\sum_{i=1}^n X_i\bigg) - \mu\bigg)\ \xrightarrow{d}\ \mathcal{N}(0,\;\sigma^2) ist Lindeberg-Lévy CLT. Ich verstehe nicht, warum es einn−−√n\sqrt{n} auf der linken Seite. Und Lyapunov CLT sagt 1sn∑i=1n(Xi−μi) →d N(0,1)1sn∑i=1n(Xi−μi) →d N(0,1) \frac{1}{s_n} \sum_{i=1}^{n} (X_i - \mu_i) \ \xrightarrow{d}\ \mathcal{N}(0,\;1) …
Ich möchte Lasso oder Ridge-Regression für ein Modell mit mehr als 50.000 Variablen verwenden. Ich möchte dies mithilfe des Softwarepakets in R tun. Wie kann ich den Schrumpfungsparameter ( ) schätzen ?λλ\lambda Bearbeitungen: Hier ist der Punkt, zu dem ich gekommen bin: set.seed (123) Y <- runif (1000) Xv <- …
Es ist Zulassungszeit für Graduiertenschulen. Ich (und viele Studenten wie ich) versuche jetzt zu entscheiden, welches Statistikprogramm ich wählen soll. Was sind einige Dinge, die diejenigen von Ihnen, die mit Statistiken arbeiten, vorschlagen, die wir über Masterstudiengänge in Statistik betrachten? Gibt es häufige Fallstricke oder Fehler, die die Schüler machen …
Ich habe eine kleine Liste von Unternehmen, die eine Plattform zum Ausführen von R-, Python- oder Oktavskripten auf Clustern bereitstellen, die auf Amazon EC2 aufbauen. Gibt es noch andere Namen, die ich hinzufügen sollte? Wolkenzahlen Opani crdata
Ich suche einen Klassifikator zu trainieren , die zwischen diskriminieren Type Aund Type BObjekte mit einer einigermaßen großen Trainingssatz von etwa 10.000 Objekte, etwa die Hälfte davon sind Type Aund die Hälfte davon Type B. Der Datensatz besteht aus 100 kontinuierlichen Merkmalen, die die physikalischen Eigenschaften der Zellen (Größe, mittlerer …
Ich habe viele Websites durchsucht, um zu wissen, was Lift genau bewirkt. Die Ergebnisse, die ich gefunden habe, handelten von der Verwendung in Anwendungen, die sich nicht von selbst unterscheiden. Ich kenne die Unterstützungs- und Vertrauensfunktion. Laut Wikipedia ist Lift beim Data Mining ein Maß für die Leistung eines Modells …
Ich sehe hier eine ähnliche eingeschränkte Regression: Eingeschränkte lineare Regression durch einen bestimmten Punkt aber meine anforderung ist etwas anders. Ich brauche die Koeffizienten, um 1 zu addieren. Insbesondere regressiere ich die Renditen von 1 Devisenserie gegen 3 andere Devisenserien, so dass Anleger ihr Engagement in dieser Serie durch eine …
Ich möchte die Zeit messen, die benötigt wird, um die Ausführung einer Funktion zu wiederholen. Sind replicate()und benutzen for-Schleifen gleichwertig? Beispielsweise: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Welches ist die bevorzugte Methode. In der Ausgabe von system.time(), ist sys+userdie tatsächliche CPU - Zeit , um das Programm zum Laufen? Ist elapsedein …
Unter welchen Bedingungen sollte jemand in Betracht ziehen, eine mehrstufige / hierarchische Analyse anstelle einer grundlegenderen / traditionelleren Analyse (z. B. ANOVA, OLS-Regression usw.) zu verwenden? Gibt es Situationen, in denen dies als obligatorisch angesehen werden könnte? Gibt es Situationen, in denen die Verwendung einer mehrstufigen / hierarchischen Analyse ungeeignet …
Ich höre sehr gerne einfache Erklärungen zu komplexen Problemen. Was ist Ihre Lieblingsanalogie oder Anekdote, die ein schwieriges statistisches Konzept erklärt? Mein Favorit ist Murrays Erklärung für die Integration mit einem Betrunkenen und ihrem Hund. Murray erklärt, wie zwei zufällige Prozesse (ein wandernder Betrunkener und ihr Hund Oliver) Einheitswurzeln haben …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.