Ich hoffe ich mache mit dem Titel Sinn. Oft wird die Nullhypothese mit der Absicht gebildet, sie abzulehnen. Gibt es einen Grund dafür oder ist es nur eine Konvention?
Ich hoffe ich mache mit dem Titel Sinn. Oft wird die Nullhypothese mit der Absicht gebildet, sie abzulehnen. Gibt es einen Grund dafür oder ist es nur eine Konvention?
Antworten:
Der Zweck des Testens statistischer Hypothesen besteht hauptsächlich darin, Selbstskepsis zu erzwingen, sodass wir vorsichtig sind, unsere Hypothese zu veröffentlichen, es sei denn, es gibt vernünftige Beweise, die dies belegen. In der üblichen Form der Hypothesentestung liefert die Nullhypothese einen "Teufelsanwalt" , der gegen uns argumentiert und unsere Hypothese nur dann verkündet, wenn wir zeigen können, dass die Beobachtungen bedeuten, dass es unwahrscheinlich ist, dass das Argument des Anwalts stichhaltig ist. Also nehmen wir um das zu sein, was wir nicht wahr sein wollen und dann sehen, ob wir es ablehnen können. Wenn wir es ablehnen können, bedeutet dies nicht, dass unsere Hypothese wahrscheinlich richtig ist, sondern dass sie diese grundlegende Hürde überwunden hat und daher eine Überlegung wert ist. Wenn dies nicht möglich ist, bedeutet dies nicht, dass unsere Hypothese falsch ist. Möglicherweise verfügen wir nur nicht über genügend Daten, um ausreichende Beweise zu liefern. Wie @Bahgat zu Recht andeutet (+1), ist dies in hohem Maße die Idee von Poppers Falsificationism-Idee.
Es ist jedoch möglich, einen Test durchzuführen, bei dem ist, was Sie für wahr halten möchten. Damit dies funktioniert, müssen Sie jedoch nachweisen, dass der Test eine ausreichend hohe statistische Aussagekraft aufweist , um sicher zu sein, dass die Null zurückgewiesen wird wenn es tatsächlich falsch ist. Das Berechnen der statistischen Leistung ist schwieriger als das Durchführen des Tests, weshalb diese Form des Testens selten verwendet wird und stattdessen normalerweise die Alternative verwendet wird, bei der H 0 das ist, was nicht wahr sein soll.
Sie müssen also nicht , um sich Ihrer Hypothese zu widersetzen, aber das Testverfahren wird dadurch viel einfacher.
Karl Popper sagt: " Wir können eine Hypothese nicht endgültig bestätigen, aber wir können sie endgültig negieren. " Wenn wir also Hypothesentests in der Statistik durchführen, versuchen wir, die entgegengesetzte Hypothese (die Nullhypothese) der Hypothese, an der wir interessiert sind (die alternative Hypothese), zu negieren (zurückzuweisen) und die wir nicht bestätigen können. Da wir die Nullhypothese leicht spezifizieren können, wissen wir aber nicht genau, was die Alternativhypothese ist. Wir können beispielsweise die Hypothese aufstellen, dass zwischen den beiden Populationen ein mittlerer Unterschied besteht, aber wir können nicht angeben, wie groß der Unterschied sein würde.
Siehe auch Nicht an die Nullhypothese glauben?
Es ist nicht selbstverständlich, dass die Null immer abzulehnen ist. Beim Testen der Modellanpassung lautet der Nullwert in der Regel, dass das Modell gut passt, und das ist etwas Wünschenswertes, das wir nicht gerne ablehnen würden. Es ist jedoch in der Regel richtig, dass die Stichprobenverteilung der Teststatistik unter der Null leichter abzuleiten ist, was in der Regel weitaus restriktiver ist als bei der Alternative. Die Null, bei der die mittlere Differenz zwischen zwei Gruppen Null ist, führt zu a-Prüfung; die Null, dass die beiden Verteilungen gleich sind, führt zum Kolmogorov-Smirnov-Test; die Null, dass das lineare Regressionsmodell keine nichtlinearen Terme über den Ramsey RESET-Test benötigt; Die Null, die ein latent variables Modell der beobachteten Kovarianzmatrix angemessen beschreibt, führt zu einem Parameterraum mit einer geringeren Dimension als eine uneingeschränkte Alternative und zu einem asymptotischen Chi-Quadrat-Test des Abstands zur glatten parametrischen Oberfläche im Raum vonvom Modell definierte Kovarianzen. Ich gehe also davon aus, dass, wie @whuber im Kommentar unten ausdrückte, die Null normalerweise eine entscheidende, wenn auch zweckmäßige technische Annahme ist. Die Null ist entweder ein Punkt (möglicherweise multivariat) im parametrischen Raum, sodass die Stichprobenverteilung vollständig angegeben ist. oder ein eingeschränkter parametrischer Raum, wobei die Alternative so formuliert werden kann, dass sie in diesem Raum komplementär ist, und die Teststatistik auf einem Abstand von dem umfangreicheren Satz von Parametern unter der Alternative zu dem Satz mit Einschränkungen unter der Null basiert; oder, in der Welt der nichtparametrischen Rang- / Ordnungsstatistik, kann die Verteilung unter der Null durch die vollständige Aufzählung aller möglichen Stichproben und Ergebnisse abgeleitet werden (häufig jedoch durch etwas Normales in großen Stichproben angenähert).
Taking the null as something different (e.g., that the means of the two groups differ by at most 0.01, with the alternative differ by more than 0.01) requires a more complicated set of derivations, e.g., looking at the worst possible situations, which in the above case would still boil down to the point null against a one-sided alternative. The worst case on the right is vs. , and on the left it is vs. .
This is a fair and good question. @Tim already gave you all you need to answer your question in a formal way, however if you are not familiar with statistical hypothesis testing you could conceptualize the null hypothesis by thinking about it in a more familiar setting.
Suppose you are being accused of having conducted a crime. Until proven guilty, you are innocent (null hypothesis). The attorney provides evidence that you are guilty (alternative hypothesis), your lawyers try to invalidate this evidence during the trial (the experiment) and in the end the judge rules whether you are innocent given the facts provided by the attorney and the lawyers. If the facts against you are overwhelming, i.e. the probability that you are innocent is very low, the judge (or jury) will conclude that your are guilty given the evidence.
Now with this in mind, you could also conceptualize features of statistical hypothesis testing, for instance why independent measurements (or evidence) are important, since after all your deserve a fair trial.
However, this is example has its limitations and eventually you have to formally understand the concept of the null hypothesis.
So to answer your questions:
Yes there is a reason for the null hypothesis (as described above).
No it's not just a convention, the null hypothesis is the core or statistical hypothesis testing or else it wouldn't work they way it is intended to.
The law of parsimony (also known as Occam's razor) is a general principle of science. Under that principle, we assume a simple world until it can be shown that the world is more complicated. So, we assume the simpler world of the null hypothesis until it can be falsified. For example:
We assume treatment A and treatment B work the same until we show differently. We assume the weather is the same in San Diego as in Halifax until we show differently, we assume men and women are paid the same until we show differently, etc.
For more, see https://en.wikipedia.org/wiki/Occam%27s_razor
If I can draw an analogy to logic, a general way to prove something is to assume the opposite and see if that leads to a contradiction. Here the null hypothesis is like the opposite, and rejecting it (i.e. showing that it is very unlikely) is like deriving the contradiction.
You do it that way because it's a way to make an unambiguous statement. Like in my field, it's much easier to say "The statement 'this drug has no benefit' has 5% chance of being right" than it is to say "The statement 'this drug has benefit' has 90% chance of being right". Of course, people want to know how much benefit is being claimed, but first they want to know it isn't zero.
The null hypothesis is always formed with the intention to reject it that is the basic idea of hypothesis testing. When you are trying to show that something is likely to be true (e.g. a treatment improves or worsens a disease), then the null hypothesis is the default position (e.g. the treatment does not make a difference to the disease). You generate evidence for your desired claim by accumulating data that is (hopefully) so far away from what should have happened under the null hypothesis (in the example patients that are randomized to receive the treatment or a placebo having the same expected outcome) that one concludes that is very unlikely to have arisen under the null hypothesis so that you can reject the null hypothesis. In contrast failure to reject the null hypothesis does not necessarily make it very likely that the null hypothesis is true (just because a clinical trial failed to show a drug works does not mean that the drug really does nothing).