Ein Anteil ist der Bruchteil einer Summe, die von einer bestimmten Art ist, entweder (i) als Zählung einer Art von Dingen aus einer Gesamtzählung oder (ii) als Bestandteil einer kontinuierlichen Variablen.
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
Angenommen, ich habe drei Populationen mit vier sich gegenseitig ausschließenden Merkmalen. Ich nehme Zufallsstichproben aus jeder Population und erstelle eine Kreuztabelle oder Häufigkeitstabelle für die von mir gemessenen Merkmale. Habe ich recht, wenn ich sage: Wenn ich testen möchte, ob eine Beziehung zwischen den Populationen und den Merkmalen besteht (z. …
Ich versuche die folgende Frage zu lösen: Spieler A hat 17 von 25 Spielen gewonnen, während Spieler B 8 von 20 Spielen gewonnen hat. Gibt es einen signifikanten Unterschied zwischen beiden Verhältnissen? Das, was in R zu tun ist, ist das Folgende: > prop.test(c(17,8),c(25,20),correct=FALSE) 2-sample test for equality of proportions …
Ich bin ein Softwareentwickler, der ein A / B-Testwerkzeug bauen möchte. Ich habe keine soliden Statistiken, habe aber in den letzten Tagen viel gelesen. Ich folge der hier beschriebenen Methodik und werde die relevanten Punkte unten zusammenfassen. Mit diesem Tool können Designer und Domain-Experten eine Website so konfigurieren, dass der …
Präzision ist definiert als: p = true positives / (true positives + false positives) Ist es richtig, dass sich die Genauigkeit 1 nähert true positivesund false positivessich 0 nähert? Gleiche Frage zum Rückruf: r = true positives / (true positives + false negatives) Ich führe derzeit einen statistischen Test durch, …
HINTERGRUND: Sicher überspringen - dient als Referenz und zur Rechtfertigung der Frage. Die Eröffnung dieses Papiers lautet: "Karl Pearsons berühmter Chi-Quadrat-Kontingenztest leitet sich aus einer anderen Statistik ab, die als z-Statistik bezeichnet wird und auf der Normalverteilung basiert. Die einfachsten Versionen von χ2χ2\chi^2 können mathematisch mit äquivalenten z-Tests identisch sein. …
Ich habe gelesen, dass der Chi-Quadrat-Test nützlich ist, um festzustellen, ob sich eine Stichprobe erheblich von einer Reihe von erwarteten Werten unterscheidet. Hier ist zum Beispiel eine Tabelle mit Ergebnissen einer Umfrage zu den Lieblingsfarben der Menschen (n = 15 + 13 + 10 + 17 = 55 Befragte insgesamt): …
In einem Kommentar zu einer anderen Frage wurde geklärt, ob es sich bei dem behandelten Thema um "Zählproportionen" oder "kontinuierliche Proportionen" handelte, und in einem Follow-up wurde darauf hingewiesen, dass es sich bei dem Unterschied um kritische Informationen handelte (zum Thema logistische / binomische vs. Beta-Regression). Was ist der Unterschied …
Ich verwende seit einiger Zeit lineare Modelle, um 2-Stichproben-Proportionen-Tests durchzuführen, habe jedoch festgestellt, dass dies möglicherweise nicht vollständig korrekt ist. Es scheint, dass die Verwendung eines verallgemeinerten linearen Modells mit einer Binomialfamilie + Identitätsverknüpfung genau die ungepoolten 2-Stichproben-Proportionen-Testergebnisse liefert. Die Verwendung eines linearen Modells (oder Glm mit Gaußscher Familie) ergibt …
Ich dachte, ich hätte dieses Problem verstanden, aber jetzt bin ich mir nicht so sicher und würde es gerne mit anderen klären, bevor ich fortfahre. Ich habe zwei Variablen Xund Y. Yist ein Verhältnis, und es ist nicht durch 0 und 1 begrenzt und ist im Allgemeinen normalverteilt. Xist ein …
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
Ich habe mich gefragt, ob mir jemand die Intuition jenseits des Clopper-Pearson CI für Proportionen erklären kann. Soweit ich weiß, enthält jedes CI eine Varianz. Für Anteile kann jedoch der Clopper-Pearson-CI berechnet werden, auch wenn mein Anteil 0 oder 1 (0% oder 100%) beträgt. Ich habe versucht, die Formeln zu …
Ich habe gerade in einem angesehenen (populären) Wissenschaftsmagazin (PM, 02/2013, S.36) über ein interessantes Experiment gelesen (leider ohne Quelle). Es erregte meine Aufmerksamkeit, weil ich intuitiv die Bedeutung des Ergebnisses bezweifelte, aber die bereitgestellten Informationen für die Reproduktion der statistischen Tests ausreichten. Die Forscher fragten sich, ob Erkältung bei kaltem …
Ich bin mit dem Konzept der kategorialen Variablen und der jeweiligen Dummy-Variablencodierung vertraut, die es uns ermöglicht, eine Ebene als Basislinie anzupassen, um Kollinearität zu vermeiden. Ich bin auch mit der Interpretation von Parameterschätzungen aus solchen Modellen vertraut: Die vorhergesagte Änderung des Ergebnisses für eine bestimmte angepasste Ebene des kategorialen …
Kann mir jemand sagen, wie dieser Diagrammtyp heißt (falls vorhanden)? Kann jemand auch Werkzeuge vorschlagen, wie einfach sie auch sein mögen, um ein solches Diagramm zu zeichnen?
In einer Binomialeinstellung ist die Zufallsvariable X, die die Anzahl der Erfolge angibt, binomial verteilt. Der Stichprobenanteil kann dann als X berechnet werden wobeinIhre Stichprobengröße ist. Mein Lehrbuch besagt dasX.nXn\frac{X}{n}nnn Dieser Anteil hat keine Binomialverteilung jedoch seit ist einfach eine skalierte Version einer binomial verteilten ZufallsvariablenX, sollte sie nicht auch …
Ein Online-Modul, das ich studiere, besagt, dass man niemals die Pearson-Korrelation mit Proportionsdaten verwenden sollte. Warum nicht? Oder wenn es manchmal in Ordnung oder immer in Ordnung ist, warum?
Ich versuche, einige Statistiken mit dem Buch Biometrie von Sokal und Rohlf (3e) zu lernen. Dies ist eine Übung im 5. Kapitel, die die Wahrscheinlichkeit, die Binomialverteilung und die Poisson-Verteilung behandelt. Mir ist klar, dass es eine Formel gibt, um eine Antwort auf diese Frage zu erhalten: Diese Gleichung ist …
Ich habe ein GLMM der Form: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Wenn ich benutze drop1(model, test="Chi"), erhalte ich andere Ergebnisse als wenn ich Anova(model, type="III")aus dem Autopaket oder benutze summary(model). Diese beiden letzteren geben die gleichen Antworten. Unter Verwendung einer Reihe …
Ich habe einen Prototyp einer Maschine, die Teile herstellt. In einem ersten Test produziert die Maschine Teile und ein binärer Klassifikator sagt mir, dass Teile defekt sind ( , normalerweise und ) und Teile gut sind.d 1 d 1 < N 1 d 1 / N 1 < 0,01 N …
Der Standardfehler eines Anteils ist der größte, den er für ein gegebenes N haben kann, wenn der fragliche Anteil 0,5 beträgt, und wird kleiner, je weiter der Anteil von 0,5 entfernt ist. Ich kann sehen, warum dies so ist, wenn ich die Gleichung für den Standardfehler eines Anteils betrachte, aber …
Ich hoffe, jemand kann bei einer meiner Meinung nach relativ einfachen Frage helfen, und ich glaube, ich kenne die Antwort, aber ohne Bestätigung ist sie zu etwas geworden, dessen ich mir einfach nicht sicher sein kann. Ich habe einige Zähldaten als Antwortvariable und möchte messen, wie sich diese Variable mit …
Ich versuche einem Wissenschaftler zu helfen, eine Studie zum Auftreten von Salmonellenmikroben zu entwerfen. Er möchte eine experimentelle antimikrobielle Formulierung mit einem Chlor (Bleichmittel) in Geflügelfarmen vergleichen. Da sich die Hintergrundraten von Salmonellen im Laufe der Zeit unterscheiden, plant er, vor der Behandlung und nach der Behandlung% Geflügel mit Salmonellen …
Ich versuche den Unterschied zwischen zu verstehen Testen der Nullhypothese (dh Testen, dass die Wahrscheinlichkeit eines "Ziels" für 2 verschiedene Populationen gleich ist, ähnlich wie bei prop.test in R) ein A / B-Test unter Verwendung einer Bayes'schen Formel wie hier beschrieben: http://www.evanmiller.org/bayesian-ab-testing.html Ist da ein Unterschied? Ist man vorzuziehen? Das …
Angenommen, ich möchte wissen, welche Stichprobengröße ich für ein Experiment benötige, bei dem ich feststellen möchte, ob der Unterschied zwischen zwei Erfolgsanteilen statistisch signifikant ist oder nicht. Hier ist mein aktueller Prozess: Sehen Sie sich historische Daten an, um Basisvorhersagen zu erstellen. Angenommen, in der Vergangenheit führt das Ergreifen einer …
Mehrere Beiträge ( hier und hier ) legen nahe, dass die Beta-Regression besser geeignet ist, wenn die abhängige Variable natürlich zwischen 0 und 1 liegt. Meine Frage ist, ob es technisch falsch ist, eine logistische Regression an die proportionale Antwortvariable anzupassen, wenn man die Angemessenheit beiseite lässt. R gibt eine …
Der Z-Test zum Vergleichen von zwei Proportionen lautet z=p^1−p^2Var(p^1−p^2)√z=p^1−p^2Var(p^1−p^2)\newcommand{\p}{\hat{p}}\newcommand{\v}{\mathrm{Var}} z=\frac{\p_1-\p_2}{\sqrt{\v(\p_1-\p_2)}} . Normalerweise wird das definiert Var(p^1−p^2)=p^(1−p^)(1/n1+1/n2),Var(p^1−p^2)=p^(1−p^)(1/n1+1/n2),\v(\p_1-\p_2)=\p(1-\hat{p})(1/n_1+1/n_2), wo p^= n1p^1+ n2p^2n1+ n2.p^=n1p^1+n2p^2n1+n2.\p=\frac{n_1 \p_1+n_2 \p_2}{n_1+n_2}. Gibt es eine schriftliche Referenz, die mich legitimiert, stattdessen die nicht gepoolte Varianz zu verwenden? V a r ( p^1- p^2) = p^1( 1 - p^1)n1+ p^2( …
Die Beta-Verteilung hängt damit zusammen, dass Binomial auch die Verteilung für Auftragsstatistiken ist . Wahrscheinlichkeitsmassenfunktion der Binomialverteilung ist f(k)=(nk)pk(1−p)n−k(1)(1)f(k)=(nk)pk(1−p)n−k f(k) = {n \choose k} p^k (1-p) ^{n-k} \tag{1} Die Wahrscheinlichkeitsdichtefunktion der Beta-Verteilung ist g(p)=1B(α,β)pα−1(1−p)β−1(2)(2)g(p)=1B(α,β)pα−1(1−p)β−1 g(p) = \frac{1}{\mathrm{B}(\alpha, \beta)} p^{\alpha-1} (1-p)^{\beta-1} \tag{2} wir können (nk)(nk)n \choose k in (1) umschreiben als …
Betrachten Sie ein faktorielles Design innerhalb des Subjekts und innerhalb des Gegenstands, bei dem die experimentelle Behandlungsvariable zwei Ebenen (Bedingungen) aufweist. Sei m1das Maximalmodell und m2das No-Random-Correlations-Modell. m1: y ~ condition + (condition|subject) + (condition|item) m2: y ~ condition + (1|subject) + (0 + condition|subject) + (1|item) + (0 + …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.