Ich denke an ein Modell, das ein Verhältnis vorhersagt , wobei a ≤ b und a > 0 und b > 0 . Das Verhältnis würde also zwischen 0 und 1 liegen .a/ba/ba/ba≤ba≤ba \le ba>0a>0a > 0b>0b>0b > 0000111 Ich könnte lineare Regression verwenden, obwohl sie natürlich nicht auf 0..1 …
Ich gebe zu, dass ich in Bezug auf Neigungsbewertungen und Kausalanalysen relativ neu bin. Eine Sache, die mir als Neuling nicht klar ist, ist, wie sich das "Ausbalancieren" unter Verwendung von Neigungsbewertungen mathematisch von dem unterscheidet, was passiert, wenn wir Kovariaten in einer Regression hinzufügen? Was ist anders an der …
Ich habe einige Probleme mit der Herleitung der Lösung für die Gratregression. Ich kenne die Regressionslösung ohne den Regularisierungsbegriff: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. λ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX + \lambda I)^{-1}X^Ty.
Weiß jemand, wie man herausfindet, ob die Punkte 7, 16 und 29 Einflusspunkte sind oder nicht? Ich habe irgendwo gelesen, dass Cooks Entfernung kleiner als 1 ist, sie aber nicht. Habe ich recht?
Ich habe mehrere Kovariaten in meiner Berechnung für ein Modell, und nicht alle sind statistisch signifikant. Sollte ich die entfernen, die nicht sind? Diese Frage diskutiert das Phänomen, beantwortet aber nicht meine Frage: Wie interpretiere ich den nicht signifikanten Effekt einer Kovariate in ANCOVA? Die Antwort auf diese Frage enthält …
Die Least-Angle-Regression und das Lasso tendieren dazu, sehr ähnliche Regularisierungspfade zu erzeugen (identisch, außer wenn ein Koeffizient Null überschreitet). Beide können durch praktisch identische Algorithmen effizient angepasst werden. Gibt es jemals einen praktischen Grund, eine Methode der anderen vorzuziehen?
Meine Frage ist, ob wir den Datensatz standardisieren müssen, um sicherzustellen, dass alle Variablen den gleichen Maßstab zwischen [0,1] haben, bevor die logistische Regression angepasst wird. Die Formel lautet: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Mein Datensatz enthält 2 Variablen, sie beschreiben dasselbe für zwei Kanäle, aber die Lautstärke ist unterschiedlich. Angenommen, es ist die …
Wenn die polynomiale Regression nichtlineare Beziehungen modelliert, wie kann sie als Sonderfall der multiplen linearen Regression betrachtet werden? Wikipedia stellt fest: "Obwohl die polynomiale Regression ein nichtlineares Modell an die Daten anpasst, ist sie als statistisches Schätzproblem linear in dem Sinne, dass die Regressionsfunktion in den geschätzten unbekannten Parametern linear …
Ich habe festgestellt, dass bei R-, Poisson- und negativen Binomial- (NB-) Regressionen für kategoriale, aber nicht kontinuierliche Prädiktoren immer dieselben Koeffizienten zu passen scheinen. Beispiel: Hier ist eine Regression mit einem kategorialen Prädiktor: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ tension, data=warpbreaks) #compare coefficients …
Ich mache eine multivariate Cox-Regression, ich habe meine signifikanten unabhängigen Variablen und Beta-Werte. Das Modell passt sehr gut zu meinen Daten. Jetzt möchte ich mein Modell verwenden und das Überleben einer neuen Beobachtung vorhersagen. Ich bin mir nicht sicher, wie ich das mit einem Cox-Modell machen soll. Bei einer linearen …
Ich versuche eine OLS-Regression durchzuführen: DV: Gewichtsänderung über ein Jahr (Anfangsgewicht - Endgewicht) IV: Ob Sie trainieren oder nicht. Es erscheint jedoch vernünftig, dass schwerere Menschen mehr Gewicht pro Trainingseinheit verlieren als dünnere. Daher wollte ich eine Kontrollvariable einfügen: CV: Anfangsstartgewicht. Das Anfangsgewicht wird jetzt jedoch BEIDE verwendet, um die …
Ich lese immer wieder über Fälle, in denen wir die Daten zentrieren (z. B. mit Regularisierung oder PCA), um den Intercept zu entfernen (wie in dieser Frage erwähnt ). Ich weiß, dass es einfach ist, aber es fällt mir schwer, das intuitiv zu verstehen. Könnte jemand die Intuition oder eine …
Ich bin ziemlich neu in diesem Bereich mit Binomialdatentests, musste aber einen durchführen, und jetzt bin ich nicht sicher, wie ich das Ergebnis interpretieren soll. Die y-Variable, die Antwortvariable, ist binomisch und die erklärenden Faktoren sind stetig. Folgendes habe ich bei der Zusammenfassung des Ergebnisses erhalten: glm(formula = leaves.presence ~ …
TL, DR: Es sieht so aus, als ob entgegen häufig wiederholter Ratschläge die einmalige Kreuzvalidierung (LOO-CV) - das heißt, derKKK fache CV mitKKK (die Anzahl der Falten) ist gleichNNN (die Anzahl) der Trainingsbeobachtungen) - liefert Schätzungen des Generalisierungsfehlers, diefür jedes K am wenigsten variabel sind, und nicht die variabelsten, wobei …
Kann mir bitte jemand eine Vorstellung davon geben, wann ich mich für SVM oder LR entscheiden soll? Ich möchte die Intuition hinter dem Unterschied zwischen den Optimierungskriterien für das Erlernen der Hyperebene der beiden verstehen, wobei die jeweiligen Ziele wie folgt lauten: SVM: Versuchen Sie, den Abstand zwischen den nächstgelegenen …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.