Ich habe zwei Populationen, eine mit N = 38.704 (Anzahl der Beobachtungen) und eine mit N = 1.313.662. Diese Datensätze haben ~ 25 Variablen, alle kontinuierlich. Ich nahm jeweils den Mittelwert in jedem Datensatz und berechnete die Teststatistik unter Verwendung der Formel
t = mittlere Differenz / Standardfehler
Das Problem ist der Freiheitsgrad. Durch die Formel df = N1 + N2-2 haben wir mehr Freiheit, als die Tabelle verarbeiten kann. Irgendwelche Vorschläge dazu? So überprüfen Sie die t-Statistik hier. Ich weiß, dass der T-Test für die Handhabung von Proben verwendet wird, aber was ist, wenn wir dies auf große Proben anwenden?