Eine Datenbank mit (Bevölkerung, Fläche, Form) kann verwendet werden, um die Bevölkerungsdichte abzubilden, indem jeder Form ein konstanter Wert für Bevölkerung / Fläche zugewiesen wird (dies ist ein Polygon wie ein Zensusblock, ein Gebiet, eine Grafschaft, ein Bundesland usw.). Die Populationen sind jedoch normalerweise nicht gleichmäßig in ihren Polygonen verteilt. Die dasymetrische Abbildung ist der Prozess der Verfeinerung dieser Dichteschätzungen mithilfe von Hilfsdaten. Es ist ein wichtiges Problem in den Sozialwissenschaften, wie aus dieser jüngsten Überprüfung hervorgeht.
Nehmen wir also an, wir hätten eine Hilfskarte der Landbedeckung (oder einen anderen diskreten Faktor) zur Verfügung. Im einfachsten Fall können wir offensichtlich unbewohnbare Gebiete wie Gewässer zur Abgrenzung dessen verwenden, wo die Bevölkerung nicht ist, und dementsprechend die gesamte Bevölkerung den verbleibenden Gebieten zuordnen. Allgemeiner wird jede Zählungseinheit in Abschnitte mit Oberflächenbereichen , geschnitten . Unser Datensatz wird dadurch um eine Liste von Tupeln erweitert
Dabei ist die Grundgesamtheit (angenommen, fehlerfrei gemessen) in der Einheit und obwohl dies nicht unbedingt der Fall ist, können wir annehmen, dass jedes auch genau gemessen wird. In diesen Begriffen besteht das Ziel darin, jedes in eine Summe aufzuteilen
wobei jedes und schätzt die Population innerhalb der Einheit in der Bodenbedeckung Klasse wohn . Die Schätzungen müssen unvoreingenommen sein. Diese Partition verfeinert die Bevölkerungsdichtekarte, indem die Dichte dem Schnittpunkt des Volkszählungspolygons und der Landbedeckungsklasse zugewiesen wird.
Dieses Problem unterscheidet sich in wesentlichen Punkten von den Standardeinstellungen für die Regression:
- Die Aufteilung jedes muss exakt sein.
- Die Komponenten jeder Partition dürfen nicht negativ sein.
- Es gibt (unter der Annahme) keinen Fehler in irgendwelchen Daten: Alle Bevölkerungszählungen und alle Bereiche x j i sind korrekt.
Es gibt viele Lösungsansätze, wie zum Beispiel die " Intelligent dasymetric mapping " -Methode, aber alle, über die ich gelesen habe, haben Ad-hoc- Elemente und ein offensichtliches Verzerrungspotential. Ich suche Antworten, die kreative, rechnergestützte statistische Methoden vorschlagen. Der sofortige Antrag betrifft eine Sammlung von c. - 10 6 Volkszählungs-Einheiten mit durchschnittlich 40 Personen pro Person (obwohl ein beträchtlicher Teil 0 Personen hat) und ungefähr einem Dutzend Landbedeckungsklassen.