Als «p-value» getaggte Fragen

Bei häufig auftretenden Hypothesentests wird die p-Wert ist die Wahrscheinlichkeit, dass ein Ergebnis extrem (oder höher) als das beobachtete Ergebnis ist, unter der Annahme, dass die Nullhypothese wahr ist.


5
Warum wir die Nullhypothese auf der Ebene von 0,05 und nicht auf der Ebene von 0,5 ablehnen (wie wir es in der Klassifikation tun)
Das Testen von Hypothesen ähnelt einem Klassifizierungsproblem. Nehmen wir also an, wir haben zwei mögliche Bezeichnungen für eine Beobachtung (Subjekt) - Schuldig gegen Nichtschuldig. Sei Nichtschuld die Nullhypothese. Wenn wir das Problem unter dem Gesichtspunkt der Klassifizierung betrachten würden, würden wir einen Klassifizierer trainieren, der die Wahrscheinlichkeit vorhersagt, dass das …

2
Zwei Definitionen des p-Wertes: Wie kann man ihre Äquivalenz beweisen?
Ich lese in Larry Wassermans Buch All of Statistics und derzeit über p-Werte (Seite 187). Lassen Sie mich zunächst einige Definitionen einführen (ich zitiere): Definition 1 Die Leistungsfunktion eines Tests mit Verwerfungsbereich RRR ist definiert durch β(θ)=Pθ(X∈R)β(θ)=Pθ(X∈R)\beta(\theta)=P_{\theta}(X\in R) Die Größe eines Tests definiert werden soll α=supθ∈Θ0β(θ)α=supθ∈Θ0β(θ)\alpha = \sup_{\theta\in\Theta_0}\beta(\theta) Ein Test …


2
p-Wert-Subtilität: größer-gleich vs. größer
Während ich Wassermanns Buch All of Statistics lese, bemerke ich eine feine Subtilität in der Definition von p-Werten, die ich nicht verstehen kann. Informell definiert der Wassermann den p-Wert als [..] die Wahrscheinlichkeit (unter H0H0H_0 ), einen Wert der Teststatistik zu beobachten, der gleich oder extremer als der tatsächlich beobachtete …


2
Wie werden gepoolte p-Werte für Tests in mehreren unterstellten Datensätzen ermittelt?
Mit Amelia in R erhielt ich mehrere unterstellte Datensätze. Danach führte ich einen Test mit wiederholten Messungen in SPSS durch. Jetzt möchte ich die Testergebnisse bündeln. Ich weiß, dass ich Rubins Regeln (implementiert durch ein beliebiges Paket mit mehreren Imputationen in R) verwenden kann, um Mittelwerte und Standardfehler zu bündeln, …


3
Was ist der Unterschied zwischen Z-Scores und p-Werten?
In Netzwerkmotivalgorithmen scheint es durchaus üblich zu sein, beide a zurückzugeben p-Wert als auch einen Z-Score für eine Statistik zurückzugeben: "Das Eingabenetzwerk enthält X Kopien des Untergraphen G". Ein Untergraph gilt als Motiv, wenn er erfüllt p-Wert <A, Z-Score> B und X> C für einige benutzerdefinierte (oder Community-definierte) A, B …


2
Kolmogorov-Smirnov-Test: Die Statistik des p-Werts und des ks-Tests nimmt mit zunehmender Stichprobengröße ab
Warum nehmen p-Werte und ks-Teststatistiken mit zunehmender Stichprobengröße ab? Nehmen Sie diesen Python-Code als Beispiel: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Die Ergebnisse sind: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) …

5
Wie teste ich einen Interaktionseffekt mit einem nicht parametrischen Test (z. B. einem Permutationstest)?
Ich habe zwei kategoriale / nominale Variablen. Jeder von ihnen kann nur zwei unterschiedliche Werte annehmen (also habe ich insgesamt 4 Kombinationen). Jede Wertekombination enthält eine Reihe numerischer Werte. Ich habe also 4 Sätze von Zahlen. Um es konkreter zu machen, nehmen wir an, ich habe male / femaleund young …

3
G-Test gegen Pearsons Chi-Quadrat-Test
Ich teste die Unabhängigkeit in einer Kontingenztabelle. Ich weiß nicht, ob der G-Test oder der Chi-Quadrat -Test von Pearson besser ist. Die Stichprobengröße liegt bei Hunderten, aber es gibt einige niedrige Zellzahlen. Wie auf der Wikipedia-Seite angegeben , ist die Annäherung an die Chi-Quadrat-Verteilung für den G-Test besser als für …

3
glm in R - welcher p-Wert repräsentiert die Anpassungsgüte des gesamten Modells?
Ich verwende glms in R (verallgemeinerte lineare Modelle). Ich dachte, ich kenne p-Werte - bis ich sah, dass das Aufrufen einer Zusammenfassung für ein glm keinen übergeordneten p-Wert ergibt, der für das gesamte Modell repräsentativ ist - zumindest nicht an der Stelle, an der lineare Modelle dies tun. Ich frage …

2
Eine "signifikante Variable", die die Vorhersagen außerhalb der Stichprobe nicht verbessert - wie zu interpretieren?
Ich habe eine Frage, von der ich denke, dass sie für viele Benutzer ziemlich einfach sein wird. Ich verwende lineare Regressionsmodelle, um (i) die Beziehung mehrerer erklärender Variablen und meiner Antwortvariablen zu untersuchen und (ii) meine Antwortvariable unter Verwendung der erklärenden Variablen vorherzusagen. Eine bestimmte erklärende Variable X scheint meine …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.