Ich habe eine Menge (ungefähr 1000) Schätzungen, und alle sollen Schätzungen der langfristigen Elastizität sein. Etwas mehr als die Hälfte davon wird mit Methode A und der Rest mit Methode B geschätzt. Irgendwo las ich so etwas wie "Ich denke, Methode B schätzt etwas ganz anderes als Methode A, weil die Schätzungen viel (50-60%) höher sind ". Ich kenne mich mit robusten Statistiken so gut wie gar nicht aus, also habe ich nur die Stichprobenmittelwerte und -mediane beider Stichproben berechnet ... und sofort den Unterschied festgestellt. Methode A ist sehr konzentriert, der Unterschied zwischen Median und Mittelwert ist sehr gering, aber die Stichprobe von Methode B variierte stark.
Ich kam zu dem Schluss, dass die Ausreißer und Messfehler die Stichprobe nach Methode B verzerren, und warf daher etwa 50 Werte (etwa 15%) weg, die mit der Theorie sehr inkonsistent waren ... und plötzlich waren die Mittelwerte beider Stichproben (einschließlich ihres CI) sehr ähnlich . Auch die Dichtediagramme.
(In dem Bestreben, Ausreißer zu eliminieren, habe ich den Bereich von Stichprobe A untersucht und alle Stichprobenpunkte in B entfernt, die außerhalb des Bereichs lagen.) Ich möchte, dass Sie mir mitteilen, wo ich einige Grundlagen für eine robuste Schätzung der Mittelwerte finden kann erlauben Sie mir, diese Situation strenger zu beurteilen. Und um einige Referenzen zu haben. Ich brauche kein sehr tiefes Verständnis für verschiedene Techniken, sondern lese einen umfassenden Überblick über die Methodik der robusten Schätzung.
Nach Entfernen der Ausreißer wurde die Signifikanz der mittleren Differenz getestet, und der p-Wert betrug 0,0559 (t um 1,9). Für die vollständigen Stichproben betrug der t-Wert etwa 4,5. Aber das ist nicht wirklich der Punkt, die Mittel können ein bisschen anders sein, aber sie sollten sich nicht um 50-60% unterscheiden, wie oben angegeben. Und ich glaube nicht, dass sie es tun.