Ich möchte einen p-Wert berechnen, um H0 auf dem Signifikanzniveau α abzulehnen, wenn p <α ist; Beweis, dass meine Bevölkerung normal verteilt ist.
Die Normalverteilung entsteht, wenn die Daten durch eine Reihe von additiven iid-Ereignissen generiert werden (siehe das Quincunx-Bild unten). Das bedeutet keine Rückmeldungen und keine Korrelationen. Klingt das nach dem Prozess, der Ihre Daten führt? Wenn nicht, ist es wahrscheinlich nicht normal.
Es besteht die Möglichkeit, dass in Ihrem Fall ein Prozess auftritt. Am ehesten können Sie "beweisen", dass Sie genügend Daten sammeln, um andere Verteilungen auszuschließen, die von Personen erstellt werden können (was wahrscheinlich nicht praktikabel ist). Eine andere Möglichkeit besteht darin, die Normalverteilung aus einer Theorie zusammen mit einigen anderen Vorhersagen abzuleiten. Wenn die Daten mit allen übereinstimmen und niemand eine andere Erklärung finden kann, wäre dies ein guter Beweis für die Normalverteilung.
https://en.wikipedia.org/wiki/Bean_machine
Wenn Sie nun keine bestimmte Verteilung von vornherein erwarten, kann es dennoch sinnvoll sein, die Normalverteilung zu verwenden, um die Daten zusammenzufassen. Beachten Sie jedoch, dass dies im Wesentlichen eine Entscheidung aus Unwissenheit ist ( https://en.wikipedia.org/wiki/). Prinzip der maximalen Entropie ). In diesem Fall möchten Sie nicht wissen, ob die Bevölkerung normal verteilt ist, sondern ob die Normalverteilung eine vernünftige Annäherung für Ihren nächsten Schritt darstellt.
In diesem Fall sollten Sie Ihre Daten (oder generierte Daten, die ähnlich sind) zusammen mit einer Beschreibung dessen, was Sie damit vorhaben, bereitstellen und dann fragen: "Inwiefern kann mich die Annahme der Normalität in diesem Fall irreführen?"