Verwirrung hinsichtlich der Verwendung von


15

Ich habe mich auf diese Videovorlesung bezogen, um das Konfidenzintervall zu berechnen . Ich habe jedoch einige Verwirrung. Dieser Typ verwendet Statistiken für die Berechnung. Ich denke jedoch, es hätte eine t- Statistik sein sollen. Wir geben nicht die wahre Standardabweichung der Population an. Wir verwenden die Standardabweichung der Stichprobe, um die wahre zu schätzen.zt

Warum nahm er dann die Normalverteilung für das Konfidenzintervall anstatt für ?t



Nur als Referenz, arbeitet das Problem auf dem Video mit einer exponierte aus t - Statistik ergeben würde: n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145.
Antoni Parellada

Antworten:


10

Du hast recht, es sollte eine t-Verteilung sein. Da die Stichprobengröße jedoch 36 (dh> 20) beträgt, wäre auch eine Az-Verteilung angemessen. Denken Sie daran, dass mit zunehmender Stichprobengröße die t-Verteilung in ihrer Form der z-Verteilung ähnlicher wird.


21

Als ich meinen ersten Statistikkurs belegte (nach den Dinosauriern, aber als echte Computer noch einen ganzen Raum einnahmen), wurde uns beigebracht, die z-Tabelle zu verwenden, wenn es mehr als 30 Freiheitsgrade gab, teilweise aufgrund der t-Tabelle im Buch Nur bis zu 30 Freiheitsgraden. Wenn Sie sich die T-Tabelle ansehen, werden Sie feststellen, dass Sie bei etwa 28 Freiheitsgraden die gleichen Ergebnisse wie bei der Z-Tabelle mit 2 signifikanten Stellen erzielen (und wenn Sie dies alles von Hand tun, neigen wir dazu öfter runden). Vielleicht ist der Moderator noch von dieser Schule.

Sie haben Recht, dass Sie, wenn Sie die Standardabweichung der Stichprobe für einen Test verwenden, die t-Verteilung unabhängig von der Größe verwenden sollten (was heutzutage viel einfacher ist) und nur dann das z (Standardnormal) verwenden sollten, wenn Sie kennen die Populationsstandardabweichung, aber aus praktischen Gründen werden Sie nicht oft einen bedeutenden Unterschied feststellen, wenn die Stichprobengröße groß ist.


1
Tolle Anekdote :)
swiecki

Ein bedauerlicher Nebeneffekt der Tatsache, dass es manchmal in Ordnung ist, Z-Intervalle zu verwenden, ist, dass einige Einführungstexte Z-Intervalle anstelle von T-Intervallen enthalten. Es gibt viele Bereiche der Wissenschaft, in denen Proben routinemäßig so klein sind, dass die Z-Intervalle völlig ungeeignet sind. Ich erzähle meinen Schülern jedes Jahr davon, mit ausdrücklichen Anweisungen, aber immer noch verwenden eine beträchtliche Anzahl von ihnen Z-Intervalle :-(
Michael Lew

4

Es fällt mir schwer, herauszufinden, ob Khan die Dinge im Video etwas vereinfacht hat oder sich einfach irrt. Ich müsste letzteres sagen, aber das Problem ist nicht in der z oder t- Frage. Er nennt das, was er als Konfidenzintervall berechnet, und sagt dann, dass er zu 92% sicher ist, dass der Mittelwert der Bevölkerung in den angegebenen Bereich fällt. Das lässt sich einfach nicht aus einem Konfidenzintervall schließen ... leider.

Dann gehe ich zurück zum Frage t vs. z und frage mich, ob er dort einen Fehler gemacht hat. Ich denke, vielleicht nicht, weil er angibt, dass Sie eine Korrektur vornehmen müssen, wenn die Stichprobe kleiner ist. Die anderen Antwortenden haben also wahrscheinlich Recht. Er benutzt nur z, weil er es bereits eingeführt hat und es mit n von 36 nah genug ist. Ich habe nicht vor, alle Videos durchzugehen, aber ich stelle mir vor, dass er die t- Distribution später einführen wird , hoffentlich die nächste.

Es ist wirklich bedauerlich, dass die Khan Academy in so vielen Bereichen der Statistik falsch liegt ... aber vielleicht fühle ich mich einfach so, weil ich nur auf Videos mit Problemen hingewiesen werde.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.