Angenommen, ich habe eine 80/20 Aufteilung zwischen Modellierungs- / Validierungsbeobachtungen. Ich habe ein Modell an den Modellierungsdatensatz angepasst und bin mit dem Fehler, den ich im Validierungsdatensatz sehe, einverstanden. Ist es angebracht, die Validierung mit den Modellierungsdaten zu kombinieren, um aktualisierte Parameterschätzungen für die 100% -Daten zu erhalten, bevor ich …
Ist die Standardisierung einer abhängigen Variablen innerhalb der identifizierenden Gruppe sinnvoll? Das folgende Arbeitspapier (Verlangsamung der Entwaldung im legalen Amazonasgebiet; Preise oder Richtlinien ?, pdf ) verwendet eine standardisierte abhängige Variable, um die Auswirkungen der allgemeinen Richtlinienänderung in Brasilien auf die Entwaldung zu analysieren. Die Standardisierung erfolgt wie folgt: Y.n …
Ich mache eine Regression mit Random Forests, um Preise basierend auf mehreren Attributen vorherzusagen. Code wird in Python mit Scikit-learn geschrieben. Wie entscheiden Sie, ob Sie Ihre Variablen mit exp/ transformieren sollen, logbevor Sie sie für das Regressionsmodell verwenden? Ist es notwendig, einen Ensemble-Ansatz wie Random Forest zu verwenden?
Wenn in Standard-OLS-Regressionen zwei Annahmen verletzt werden (Normalverteilung von Fehlern, Homoskedastizität), sind Bootstrapping-Standardfehler und Konfidenzintervalle eine geeignete Alternative, um zu aussagekräftigen Ergebnissen hinsichtlich der Signifikanz von Regressorkoeffizienten zu gelangen? Funktionieren Signifikanztests mit Bootstrap-Standardfehlern und Konfidenzintervallen immer noch mit Heteroskedastizität? Wenn ja, welche Konfidenzintervalle können in diesem Szenario verwendet werden (Perzentil, …
Ziemlich grundlegende Frage: Was bedeutet eine Normalverteilung von Residuen aus einer linearen Regression? Wie wirkt sich dies auf meine ursprünglichen Daten aus der Regression aus? Ich bin total ratlos, danke Jungs
Meine Vorhersagen aus einem logistischen Regressionsmodell (glm in R) sind nicht wie erwartet zwischen 0 und 1 begrenzt. Mein Verständnis der logistischen Regression ist, dass Ihre Eingabe- und Modellparameter linear kombiniert werden und die Antwort mithilfe der Logit-Link-Funktion in eine Wahrscheinlichkeit umgewandelt wird. Da die Logit-Funktion zwischen 0 und 1 …
Kann jemand helfen, einige der Mathematik hinter der Klassifizierung in CART zu erklären? Ich möchte verstehen, wie zwei Hauptphasen ablaufen. Zum Beispiel habe ich einen CART-Klassifikator für ein Dataset trainiert und ein Test-Dataset verwendet, um die prädiktive Leistung zu kennzeichnen, aber: Wie wird die ursprüngliche Wurzel des Baumes gewählt? Warum …
Ich bin nicht sicher, wie ich diese Probit-Regression interpretieren soll, die ich für Stata durchgeführt habe. Die Daten befinden sich in der Kreditgenehmigung und Weiß ist eine Dummy-Variable, die = 1 ist, wenn eine Person weiß war, und = 0 ist, wenn die Person nicht weiß war. Jede Hilfe zum …
Eine der Beweggründe für das elastische Netz war die folgende Einschränkung von LASSO: Im Fall p>np>np > n wählt das Lasso aufgrund der Art des konvexen Optimierungsproblems höchstens n Variablen aus, bevor es gesättigt wird. Dies scheint ein einschränkendes Merkmal für eine variable Auswahlmethode zu sein. Darüber hinaus ist das …
Ich habe die Rangprozentsätze der Studenten in 38 Prüfungen als abhängige Variable in meinem Studium. Ein Rangprozentsatz wird berechnet durch (Rang eines Schülers / Anzahl von Schülern in einer Prüfung). Diese abhängige Variable ist nahezu gleichmäßig verteilt, und ich möchte die Auswirkungen einiger Variablen auf die abhängige Variable abschätzen. Welchen …
Angenommen , Xβ=YXβ=YX\beta =Y . Wir wissen nicht , YYY genau, nur ihre Korrelation mit jedem Prädiktor, XtYXtYX^\mathrm{t}Y . Die gewöhnliche Lösung der kleinsten Quadrate (OLS) ist β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y und es gibt kein Problem. Angenommen, XtXXtXX^\mathrm{t}X ist nahezu singulär (Multikollinearität), und Sie müssen den optimalen Kammparameter schätzen. Alle Methoden …
Ich habe mich gefragt, wie Sie Daten aus einer Poisson-Regressionsgleichung in R generieren würden. Ich bin irgendwie verwirrt, wie ich das Problem angehen soll. Wenn ich also annehme, dass wir zwei Prädiktoren und X 2 haben, die auf N ( 0 , 1 ) verteilt sindX1X1X_1X2X2X_2N(0,1)N(0,1)N(0,1) . Und der Achsenabschnitt …
In den meisten Beispielen, die ich bisher für neuronale Netze gesehen habe, wird das Netz zur Klassifizierung verwendet, und die Knoten werden mit einer Sigmoidfunktion transformiert. Ich möchte jedoch ein neuronales Netzwerk verwenden, um einen kontinuierlichen Realwert auszugeben (realistisch wäre die Ausgabe normalerweise im Bereich von -5 bis +5). Meine …
Ich gehe die Videos in Andrew Ngs kostenlosem Online-Kurs für maschinelles Lernen in Stanford durch. Er beschreibt Gradient Descent als einen Algorithmus zum Lösen linearer Regression und zum Ausführen von Schreibfunktionen in Octave. Vermutlich könnte ich diese Funktionen in R umschreiben, aber meine Frage ist, gibt mir die Funktion lm …
Ich versuche nur zu verstehen, welche Beziehung zwischen einer normalen multiplen / einfachen Regression und einer multiplen / einfachen Regression besteht, wenn die Variablen differenziert werden. Zum Beispiel analysiere ich die Beziehung zwischen Einlagensaldo ( ) und Marktzinsen ( R T ). Wenn ich eine einfache lineare Regression durchführe, ist …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.