Neuartige Methoden zum Ausfüllen fehlender Werte in einem Raster


8

Ich suche nach robusten Möglichkeiten, um fehlende Werte in einigen Rastern einzufügen. Sie haben alle eine einzige Schicht. Fehlende Werte bestehen aus einzelnen Pixeln bis zu mittelgroßen Patches. Raster sind etwa 1000 x 1000 Pixel groß und die größten Patches haben eine Größe von 20 x 20 Pixel.

Ich bin versucht, aregImpute im Hmisc R-Paket zu verwenden. Hat es jemand für diesen Zweck benutzt?

Dieser Ansatz sieht sehr cool aus, aber ich denke, er soll nur ästhetisch ansprechende Korrekturen bewirken.

Detaillierte Erklärung hierzu:

Alle Raster (ich habe insgesamt 36) haben das gleiche Ausmaß, sie überlappen sich und sind ausgerichtet. Jedes Raster ist eine andere Variable. Ich habe Variablen aus verschiedenen Quellen (Fernerkundung, topografisch und klimatologisch) gesammelt. Die Original-Raster sind in verschiedenen Auflösungen erhältlich. Der kleinste ist 30m. Von dort steigen sie bis zu 1 km hoch. Ich habe alles mit kubischer Faltung (alle Variablen sind Continuos) auf 1 km neu abgetastet. Ich habe ein weiteres 1 km-Raster, in dem ich Daten einer interessierenden Variablen für einige Stichprobenpunkte habe. Also habe ich ein Modell trainiert, das diese Punkte und die anderen Raster als Kovariaten verwendet, um ein vollständiges Raster dieser Variablen zu generieren. Leider haben die meisten kovariaten Raster einige fehlende Werte, eigentlich nicht viel, aber ich möchte das Problem vollständig beseitigen.

Vielen Dank.

ps Ich würde dafür vorzugsweise R verwenden.


Was ist der Grund für das Fehlen und warum geben Sie die Werte ein? (Beides spielt bei der Auswahl einer geeigneten Lösung eine Rolle.) Was genau meinen Sie mit "robust"? (Es hat einen technischen statistischen Sinn, aber es ist noch nicht klar, wie das hier zutreffen würde.)
whuber

Ich verwende die Ebenen als Kovariaten für ein Vorhersagemodell. Das Modell, das ich verwende, verarbeitet keine fehlenden Werte, daher berechnet es einfach keine Pixel mit einem fehlenden Wert in einem der Raster und hinterlässt Löcher in meiner "vorhergesagten Ebene". Vielleicht wurde das Wort robust schlecht verwendet, ich entschuldige mich. Was ich suchen würde, ist, dass die Imputation die zugrunde liegende Beziehung zwischen meinen Kovariaten und meiner objektiven Variablen bewahrt. Ich bin mir nicht sicher, wie ich das nennen soll, die vielfältige Annahme?
JEquihua

Abhängig von der Variablen wird die Fehlstellung durch Sensorfehler oder Messfehler verursacht, die durch einen fehlenden Wert ersetzt werden.
JEquihua

Überlappen sich Ihre Raster oder nicht? Wenn sie sich nicht überlappen oder wenn die typische Überlappung nur zwei oder drei Raster an einem Punkt beträgt, ist es schwierig, viel Wert daraus zu ziehen aregImpute. Andernfalls ist dies ein vielversprechender Ansatz, der noch attraktiver wäre, wenn Sie räumliche Korrelationsterme in das Modell aufnehmen würden.
whuber

1
Daten, die aufgrund von Erfassungsproblemen fehlen, sind immer räumlich korreliert. Ich vermute, dass jede vernünftige Methode, die diese Korrelation berücksichtigt, egal wie einfach sie sonst ist, eine bessere Leistung erbringt als selbst die ausgefeiltesten Methoden, die diese Korrelation vernachlässigen. Das Resampling könnte ein Problem sein, aber es ist unklar, was Sie getan haben. Eine ausführlichere Erklärung in Ihrer Frage wäre willkommen. (Ein gutes allgemeines Prinzip besteht darin, Ihre statistischen Analysen mit Originaldaten anstatt mit neu abgetasteten Daten durchzuführen, wenn Sie können, um Artefakte der
erneuten Abtastung

Antworten:


5

Ich bin der Autor des R-Pakets gapfill, eines flexiblen Tools zur Vorhersage fehlender Werte in räumlich-zeitlichen Fernerkundungsdatensätzen. https://CRAN.R-project.org/package=gapfill Dies könnte in Ihrem Fall hilfreich sein.

Eine Übersicht über veröffentlichte Methoden zur Vorhersage fehlender Werte in Fernerkundungsdatensätzen finden Sie in Tabelle 1 der entsprechenden Veröffentlichung https://doi.org/10.1109/TGRS.2017.2785240 .


1
Interessantes Paket. Gute Arbeit!
Aldo_Tapia
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.