Warum brauchen wir überhaupt eine alternative Hypothese?
Bei einem klassischen Hypothesentest spielt die alternative Hypothese nur eine mathematische Rolle, da sie die Reihenfolge der Beweise durch die ausgewählte Teststatistik beeinflusst. Die alternative Hypothese wird verwendet, um die geeignete Teststatistik für den Test zu bestimmen. Dies entspricht der Festlegung einer ordinalen Rangfolge aller möglichen Datenergebnisse von denjenigen, die der Nullhypothese am förderlichsten sind (gegen die angegebene Alternative), bis zu denjenigen, die den Nullhypothesen am wenigsten förderlich sind (gegen die angegebene Alternative). Sobald Sie diese ordinale Rangfolge der möglichen Datenergebnisse gebildet haben, spielt die alternative Hypothese im Test keine weitere mathematische Rolle .
Formale Erklärung: In jedem klassischen Hypothesentest mit n beobachtbare Datenwerte x=(x1,...,xn) Sie haben einige Teststatistik T:Rn→RDadurch wird jedes mögliche Ergebnis der Daten auf eine Ordnungsskala abgebildet, die misst, ob es der Null- oder Alternativhypothese förderlicher ist. (Ohne Verlust der Allgemeinheit gehen wir davon aus, dass niedrigere Werte der Nullhypothese förderlicher sind und höhere Werte der alternativen Hypothese förderlicher sind. Wir sagen manchmal, dass höhere Werte der Teststatistik "extremer" sind, sofern sie extremer sind Beweis für die alternative Hypothese.) Der p-Wert des Tests ist dann gegeben durch:
p(x)≡pT(x)≡P(T(X)⩾T(x)|H0).
This p-value function fully determines the evidence in the test for any data vector. When combined with a chosen significance level, it determines the outcome of the test for any data vector. (We have described this for a fixed number of data points n but this can easily be extended to allow for arbitrary n.) It is important to note that the p-value is affected by the test statistic only through the ordinal scale it induces, so if you apply a monotonically increasing transformation to the test statistics, this makes no difference to the hypothesis test (i.e., it is the same test). This mathematical property merely reflects the fact that the sole purpose of the test statistic is to induce an ordinal scale on the space of all possible data vectors, to show which are more conducive to the null/alternative.
The alternative hypothesis affects this measurement only through the function T, which is chosen based on the stated null and alternative hypotheses within the overall model. Hence, we can regard the test statistic function as being a function T≡g(M,H0,HA) of the overall model M and the two hypotheses. For example, for a likelihood-ratio-test the test statistic is formed by taking a ratio (or logarithm of a ratio) of supremums of the likelihood function over parameter ranges relating to the null and alternative hypotheses.
What does this mean if we compare tests with different alternatives? Suppose you have a fixed model M and you want to do two different hypothesis tests comparing the same null hypothesis H0 against two different alternatives HA and H′A. In this case you will have two different test statistic functions:
T=g(M,H0,HA)T′=g(M,H0,H′A),
leading to the corresponding p-value functions:
p(x)=P(T(X)⩾T(x)|H0)p′(x)=P(T′(X)⩾T′(x)|H0).
It is important to note that if T and T′ are monotonic increasing transformations of one another then the p-value functions p and p′ are identical, so both tests are the same test. If the functions T and T′ are not monotonic increasing transformations of one another then we have two genuinely different hypothesis tests.