Der Begriff "Kalibrierung" für Vermessungsgewichte scheint von Deville und Sarndal (1992) geprägt worden zu sein . Sie legten einen Regenschirm auf eine Reihe verschiedener Verfahren, bei denen die bekannten Bevölkerungszahlen verwendet wurden:
∑i∈UYi=Ti
wo Yi ist ein Vektor von Merkmalen, die für jede Einheit in der Bevölkerung bekannt sind U. Für die allgemeine menschliche Bevölkerung wären dies Volkszählungsdaten zu demografischen Merkmalen wie Alter, Geschlecht, Rasse / ethnischer Zugehörigkeit, Bildung, Geographie (Regionen, Bundesstaaten, Provinzen) und möglicherweise Einkommen. Für Niederlassungspopulationen haben diese Variablen typischerweise mit der Größe und dem Einkommen der Niederlassung zu tun. Für Listenbeispiele - was auch immer Sie Ihrem Beispiel beigefügt haben.
Deville und Sarndal (1992) diskutierten, wie man von Entwurfsgewichten (inverse Auswahlwahrscheinlichkeiten) ausgeht. di,i∈S wo S ist die Stichprobe aus Uzu kalibrierten Gewichten wi so dass
∑i∈Swiyi=Ti
Das heißt, die Stichprobe stimmt mit der Grundgesamtheit dieser Variablen überein. Sie haben dies getan, indem sie eine Distanzfunktion optimiert haben
F(wi,di)≥0→min,F(ri,ri)=0, subject to ∑i∈Swiyi=Ti
In der Regel, wie dies in der Statistik häufig der Fall ist, verbessert das Einbringen zusätzlicher Informationen die Varianzen asymptotisch, kann jedoch zu Problemen führen und seltsame kleine Stichprobenverzerrungen verursachen. Deville und Sarndal (1992) quantifizierten diese asymptotischen Effizienzgewinne, was ihr zentraler Beitrag zur Literatur war.
In Bezug auf die Verwendung von Hilfsdaten ist die Umfragestatistik ein ziemlich einzigartiger Zweig. Bayesianische Leute verwenden Hilfsdaten in ihren Prioren. Die iid-Frequentisten / Likelihoodisten haben normalerweise keine große Möglichkeit, Hilfsinformationen aufzunehmen, wie es scheint, da alle Informationen in der Likelihood enthalten sein müssen. Es gibt jedoch einen Zweig der empirischen Wahrscheinlichkeitsschätzung, bei dem Hilfsinformationen verwendet werden, um Schätzgleichungen zu erzeugen und / oder zu aggregieren; Tatsächlich ist die empirische Wahrscheinlichkeit objektiver Funktionen einer der objektiven Funktionsfälle, die von Deville und Sarndal (1992) betrachtet werden. (Ökonomen sollten ganz richtig schnüffeln und darauf hinweisen, dass sie seit Hansen (1982) seit mehr als 30 Jahren wissen, wie statistische Modelle mithilfe einer verallgemeinerten Methode von Momenten kalibriert werden können. ). Ein quadratischer Verlust ist ein weiterer natürlich interessanter Fall in Deville und Sarndal (1992); Während es am einfachsten zu berechnen ist, kann es zu negativen Gewichten führen, die normalerweise als seltsam angesehen werden.)
Eine andere Verwendung des Begriffs " Kalibrierung " in Statistiken, von denen ich gehört habe, ist die umgekehrte Regression, bei der Sie ungenaue Messungen der interessierenden Variablen haben und den Wert des Prädiktors wiederherstellen möchten (das laufende Beispiel, das mir von meinem gegeben wurde Der Marathonläufer eines Statistikprofessors maß die Distanz der Strecke, indem er sie radelte und die Umdrehungen der Fahrradräder zählte, im Vergleich zu genaueren GPS-Messungen - das war in den späten 1990er Jahren vor Smartphones und tragbaren GPS-Geräten.) Sie kalibrieren Ihr Fahrrad auf einem etablierten 1 km langen Kurs und versuchen Sie dann, herumzufahren, um 42 so viel zu bekommen.
Es kann noch andere Verwendungen geben. Ich bin mir nicht sicher, ob es besonders klug ist, sie alle in einem Eintrag abzulegen. Sie haben die Faktoranalyse als einen potenziellen Benutzer dieses Begriffs angegeben, aber ich weiß nicht genau, wie sie dort verwendet wird.