Wenn wir die lineare Regression durchzuführen passen eine Reihe von Datenpunkten ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x n , y n ) minimiert der klassische Ansatz den quadratischen Fehler. Ich war lange verwirrt von …
Ich habe versucht, die Ergebnisse der Option Stata robustin R zu replizieren . Ich habe den rlmBefehl aus dem MASS-Paket und auch den Befehl lmrobaus dem Paket "robustbase" verwendet. In beiden Fällen unterscheiden sich die Ergebnisse erheblich von der Option "robust" in Stata. Kann jemand bitte etwas in diesem Zusammenhang …
Gibt es empirische Studien, die die Anwendung der einen Standardfehlerregel zugunsten von Sparsamkeit rechtfertigen? Es hängt natürlich vom Datenerzeugungsprozess der Daten ab, aber alles, was einen großen Datenbestand analysiert, wäre eine sehr interessante Lektüre. Die "Ein-Standard-Fehler-Regel" wird angewendet, wenn Modelle durch Kreuzvalidierung (oder allgemeiner durch ein zufallsbasiertes Verfahren) ausgewählt werden. …
Meine Frage ist, ob wir den Datensatz standardisieren müssen, um sicherzustellen, dass alle Variablen den gleichen Maßstab zwischen [0,1] haben, bevor die logistische Regression angepasst wird. Die Formel lautet: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Mein Datensatz enthält 2 Variablen, sie beschreiben dasselbe für zwei Kanäle, aber die Lautstärke ist unterschiedlich. Angenommen, es ist die …
Ich suche nach Rangdaten, bei denen in einigen Fällen der größere Wert den Rang 1 hat. Ich bin relativ neu in R, sehe aber nicht, wie ich diese Einstellung in der Rangfunktion anpassen kann. x <- c(23,45,12,67,34,89) rank(x) erzeugt: [1] 2 4 1 5 3 6 wenn ich es will: …
Ich habe AIC und AICc berechnet, um zwei allgemeine lineare gemischte Modelle zu vergleichen. Die AICs sind positiv, wobei Modell 1 einen niedrigeren AIC als Modell 2 aufweist. Die Werte für AICc sind jedoch beide negativ (Modell 1 ist immer noch <Modell 2). Ist es gültig, negative AICc-Werte zu verwenden …
Was ist der Unterschied zwischen einer Population und einer Stichprobe? Welche gemeinsamen Variablen und Statistiken werden für jede verwendet und in welcher Beziehung stehen diese zueinander?
In einer Einführung in das statistische Lernen mit Anwendungen in R schreiben die Autoren, dass das Anpassen eines Entscheidungsbaums sehr schnell ist, aber das ergibt für mich keinen Sinn. Der Algorithmus muss jedes Feature durchlaufen und auf jede mögliche Weise partitionieren, um die optimale Aufteilung zu finden. Bei numerischen Features …
Ich erhalte eine 100% ige Genauigkeit für meinen Entscheidungsbaum. Was mache ich falsch? Das ist mein Code: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split x_train = x[0:2635] …
Es ist oft offensichtlich, warum man einen unvoreingenommenen Schätzer bevorzugt. Aber gibt es Umstände, unter denen wir einen voreingenommenen Schätzer einem unvoreingenommenen vorziehen könnten?
Soll ich zum Zeichnen mit R ggplot2 oder ggvis lernen? Ich möchte nicht unbedingt beides lernen, wenn einer von ihnen in irgendeiner Hinsicht überlegen ist. Warum erstellt die R-Community immer wieder neue Pakete mit überlappenden Funktionen? In dem einleitenden Blogpost wird kein Wort darüber verloren, warum ggvis erstellt wird, da …
Ich habe auf dieser Website zahlreiche Fragen zu Bootstrapping und Konfidenzintervallen geprüft, bin aber immer noch verwirrt. Ein Grund für meine Verwirrung ist wahrscheinlich, dass ich in meinen statistischen Kenntnissen nicht weit genug fortgeschritten bin, um viele der Antworten zu verstehen. Ich bin ungefähr in der Mitte eines Statistik-Einführungskurses und …
Wenn die polynomiale Regression nichtlineare Beziehungen modelliert, wie kann sie als Sonderfall der multiplen linearen Regression betrachtet werden? Wikipedia stellt fest: "Obwohl die polynomiale Regression ein nichtlineares Modell an die Daten anpasst, ist sie als statistisches Schätzproblem linear in dem Sinne, dass die Regressionsfunktion in den geschätzten unbekannten Parametern linear …
Die bedingte Quantilsregression Schätzer durch Koenker und Basset (1978) für die Quantil ist definiert als β Q R = min b n Σ i = 1 & rgr; τ ( y i - X ' i b τ ) wobei & rgr; τ = u i ⋅ ( τ - …
Ich habe festgestellt, dass bei R-, Poisson- und negativen Binomial- (NB-) Regressionen für kategoriale, aber nicht kontinuierliche Prädiktoren immer dieselben Koeffizienten zu passen scheinen. Beispiel: Hier ist eine Regression mit einem kategorialen Prädiktor: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ tension, data=warpbreaks) #compare coefficients …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.