Ich werde alle biologischen Details und Experimente eliminieren und nur das vorliegende Problem und das, was ich statistisch getan habe, zitieren. Ich würde gerne wissen, ob es richtig ist und wenn nicht, wie es weitergeht. Wenn die Daten (oder meine Erklärung) nicht klar genug sind, werde ich versuchen, sie durch Bearbeiten besser zu erklären.
Angenommen, ich habe zwei Gruppen / Beobachtungen, X und Y, mit der Größe und N y = 40 . Ich würde gerne wissen, ob die Mittel dieser beiden Beobachtungen gleich sind. Meine erste Frage ist:
Wenn die Annahmen erfüllt sind, ist es relevant, hier einen parametrischen Zwei-Stichproben-T-Test zu verwenden? Ich frage dies, weil es meines Wissens normalerweise angewendet wird, wenn die Größe klein ist.
Ich zeichnete Histogramme von X und Y und sie waren nicht normal verteilt, eine der Annahmen eines t-Tests mit zwei Stichproben. Meine Verwirrung ist, dass ich sie als zwei Populationen betrachte und deshalb auf Normalverteilung geprüft habe. Aber dann mache ich gleich einen T-Test mit zwei SAMPLE ... Stimmt das?
Aus dem zentralen Grenzwertsatz geht hervor, dass wenn Sie eine Stichprobe (mit / ohne Wiederholung, abhängig von Ihrer Populationsgröße) mehrmals durchführen und jedes Mal den Durchschnitt der Stichproben berechnen, diese ungefähr normalverteilt sind. Der Mittelwert dieser Zufallsvariablen ist eine gute Schätzung des Populationsmittelwerts. Also habe ich mich entschlossen, dies 1000-mal sowohl für X als auch für Y zu tun, und Proben erhalten und dem Mittelwert jeder Probe eine Zufallsvariable zugewiesen. Die Handlung war sehr normal verteilt. Der Mittelwert von X und Y betrug 4,2 und 15,8 (was der Bevölkerung + - 0,15 entsprach), und die Varianz betrug 0,95 und 12,11.
Ich habe einen t-Test für diese beiden Beobachtungen (jeweils 1000 Datenpunkte) mit ungleichen Abweichungen durchgeführt, da sie sehr unterschiedlich sind (0,95 und 12,11). Und die Nullhypothese wurde abgelehnt.
Macht das überhaupt Sinn? Ist dieser korrekte / aussagekräftige Ansatz oder ein Z-Test mit zwei Stichproben ausreichend oder völlig falsch?Ich habe auch einen nicht-parametrischen Wilcoxon-Test durchgeführt, um sicherzugehen (auf Original X und Y), und die Nullhypothese wurde auch dort überzeugend zurückgewiesen. Für den Fall, dass meine vorherige Methode völlig falsch war, ist die Durchführung eines nichtparametrischen Tests, abgesehen von der statistischen Aussagekraft, möglicherweise sinnvoll.
In beiden Fällen waren die Mittelwerte signifikant unterschiedlich. Ich würde jedoch gerne wissen, ob einer oder beide Ansätze fehlerhaft / völlig falsch sind, und wenn ja, welche Alternative gibt es?