Dieses Tag enthält Fragen zu Definitionen statistischer Begriffe. Verwenden Sie ein allgemeineres Tag [Terminologie] für Fragen zur statistischen Sprache, bei denen es nicht speziell um Definitionen geht.
Ich weiß sehr wenig über Wahrscheinlichkeit und Statistik und möchte lernen. Ich sehe das Wort "Verteilung", das überall in verschiedenen Zusammenhängen verwendet wird. Beispielsweise hat eine diskrete Zufallsvariable eine "Wahrscheinlichkeitsverteilung". Ich weiß was das ist. Eine stetige Zufallsvariable hat eine Wahrscheinlichkeitsdichtefunktion. Für ist das Integral von bis der Wahrscheinlichkeitsdichtefunktion die …
Ich experimentiere mit dem Algorithmus der Gradientenverstärkungsmaschine über das caretPaket in R. Unter Verwendung eines kleinen Datensatzes für Hochschulzulassungen habe ich den folgenden Code ausgeführt: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting …
Ich schreibe über die Verwendung einer "gemeinsamen Wahrscheinlichkeitsverteilung" für ein Publikum, das mit größerer Wahrscheinlichkeit die "multivariate Verteilung" verstehen würde, und überlege daher, die spätere zu verwenden. Dabei möchte ich aber nicht den Sinn verlieren. Wikipedia scheint darauf hinzuweisen, dass es sich um Synonyme handelt. Sind sie? Wenn nein, warum …
Ich habe den Begriff "Heywood-Fall" informell verwendet, um Situationen zu bezeichnen, in denen eine online durchgeführte, "endliche Antwort" iterativ aktualisierte Schätzung der Varianz aufgrund von numerischen Genauigkeitsproblemen negativ wurde. (Ich verwende eine Variante der Welford-Methode, um Daten hinzuzufügen und ältere Daten zu entfernen.) Ich hatte den Eindruck, dass sie auf …
Dies ist die Definition für Statistik auf Wikipedia Genauer gesagt definiert die statistische Theorie eine Statistik als Funktion einer Stichprobe, wobei die Funktion selbst unabhängig von der Verteilung der Stichprobe ist. Das heißt, die Funktion kann vor der Realisierung der Daten angegeben werden. Der Begriff Statistik wird sowohl für die …
Ich bin gerade dabei, ein Dia-Set für die "Faktoranalyse" zu durchlaufen (PCA, soweit ich das beurteilen kann). Darin wird der "Fundamentalsatz der Faktoranalyse" abgeleitet, der besagt, dass die Korrelationsmatrix der in die Analyse Daten ( ) unter Verwendung der Matrix der Faktorladungen ( ) wiederhergestellt werden kann :RR\bf RAA\bf A …
Laut M. Katz in seinem Buch Multivariable Analysis (Abschnitt 1.2, Seite 6) ist „ ein Confounder mit dem Risikofaktor verbunden und steht in ursächlichem Zusammenhang mit dem Ergebnis. “ Warum muss der Confounder in ursächlichem Zusammenhang mit dem Ergebnis stehen? Wäre es genug sein für die confounder werden im Zusammenhang …
Dies ist eindeutig nur eine Frage der Definition oder Konvention und hat praktisch kaum Bedeutung. Wenn αα\alpha auf seinen traditionellen Wert von 0,05 eingestellt ist, wird ein Wert von 0,0500000000000 als statistisch signifikant angesehen oder nicht? Wird die Regel zur Definition der statistischen Signifikanz normalerweise als oder ?p < α …
Der Kontext dieser Frage befindet sich in einem Gesundheitsrahmen, dh es werden eine oder mehrere Therapien bei der Behandlung einer Erkrankung untersucht. Es scheint, dass selbst angesehene Forscher die Begriffe Wirksamkeit und Wirksamkeit verwechseln , indem sie sie austauschbar verwenden. Wie kann man Wirksamkeit gegen Wirksamkeit auf eine Weise denken, …
Ich habe das gesehen Betreiber überall in einiger Literatur ich auf Kausalitäts tue (siehe zum Beispiel des Wikipedia - Eintrag ). Ich kann jedoch keine formale und allgemeine Definition dieses Operators finden.do(x)do(x)do(x) Kann mir jemand einen guten Hinweis dazu geben? Ich interessiere mich eher für eine allgemeine Definition als für …
Ich kann Thompson Sampling und seine Funktionsweise nicht verstehen . Ich las über Multi Arm Bandit und nachdem ich den Upper Confidence Bound Algorithmus gelesen hatte, schlugen viele Texte vor, dass Thompson Sampling eine bessere Leistung als UCB erbringt. Was ist Thompson Sampling? Zögern Sie nicht, Referenzartikel zum besseren Verständnis …
Eine peinlich einfache Frage - aber es scheint, dass sie bei Cross Validated noch nicht gestellt wurde: Was ist die Definition eines Regressionsmodells? Auch eine Support-Frage, Was ist kein Regressionsmodell? In Bezug auf Letzteres interessieren mich knifflige Beispiele, bei denen die Antwort nicht sofort offensichtlich ist. Beispielsweise, Was ist mit …
Ich höre diese Wörter immer mehr, während ich maschinelles Lernen studiere. Tatsächlich haben einige Leute die Fields-Medaille gewonnen, indem sie an Gleichungssystemen gearbeitet haben. Ich denke, dies ist ein Begriff, der sich von statistischer Physik / Mathematik zum maschinellen Lernen hinzieht. Natürlich konnten einige Leute, die ich gefragt habe, dies …
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.