Wie werden ungleichmäßig abgetastete kategoriale Daten gerastert?

Ich suche nach einer Methode zum Gittern von kategorialen Daten. Ich habe aus Seekarten und Feldblättern eine Sammlung von Punkten extrahiert, die die Art der Oberfläche des Meeresbodens spezifizieren. Diese Daten sind eher kategorisch als numerisch und werden weder regelmäßig noch zufällig ausgewählt. Seekarten werden erstellt, um die Navigation und Verankerung zu erleichtern. Sie werden nicht erstellt, um den Lebensraum abzubilden. Daher werden in Küstennähe mehr Sondierungen durchgeführt, bei denen relativ geringe Tiefen eine Gefahr für die Navigation darstellen können und bei denen Schiffe zum Ankern neigen. Weiter vom Ufer entfernt, wo die Tiefen für die Navigation mehr als ausreichend sind und die Verankerung unpraktisch ist, werden Sondierungen viel seltener durchgeführt.

Hat jemand anderes versucht, Gitter-Substratkarten aus Seekarten zu erstellen?

Ich habe mir Thiessen (Vornoi) -Polygone angesehen, aber die Konzentration der Sondierungen entlang der Ufer führt zu einer feinen „Wabe“ entlang der Küste, großen Polygonen vor der Küste und zwischen langen, kuchenförmigen Polygonen, die sich weit vor der Küste erstrecken. Das Gittern mit dem nächsten Nachbarn liefert fast das gleiche Ergebnis.

Ich brauche einen Weg, um den Einfluss der flachen, küstennahen Punkte zu begrenzen - einen Weg, um diese langen, kuchenförmigen Polygone zu begrenzen. In tieferen Gewässern erwarte ich nicht, dass die Beschaffenheit des Bodens eine Fortsetzung des küstennahen Bodens sein wird. Ich begann in zwei Richtungen zu denken - beide mit Tiefe. Eine ist die Gewichtung der Wahl des "nächsten" Nachbarn anhand des Tiefenunterschieds zwischen einer Gitterzelle und benachbarten Punkten. Eine andere Möglichkeit besteht darin, benachbarte Punkte abzuwählen, die mehr als eine bestimmte Toleranz aufweisen, die sich in der Tiefe unterscheidet. Oder, vielleicht anstelle einer vorgegebenen Toleranz, könnte ich Tiefenbereiche ablegen und dann die Auswahl benachbarter Punkte auf diejenigen im gleichen Tiefenbereich oder Bin beschränken.

Überlegen Sie, wie Sie eine dieser beiden Optionen implementieren können?

Seit ich mit Kollegen in anderen Foren gesprochen habe, habe ich mir einige andere Ansätze angesehen. Die erste besteht darin, eine Barriere - die 100 m tiefe Kontur - zu verwenden, um den Einfluss küstennaher Daten zu begrenzen. Die Herausforderung bei diesem Ansatz besteht darin, dass alle ESRI-Interpolationsroutinen, die Barrieren verwenden können, so konzipiert sind, dass sie mit kontinuierlichen Daten und nicht mit diskontinuierlichen Daten arbeiten. Ich könnte die Barrieren nutzen, um die Punkte in flache küstennahe und tiefere Punkte aufzuteilen, bevor ich Thiessen-Polygone erschaffe. Ich erwarte jedoch weit verbreitete Kanteneffekte, da ArcGIS Thiessen-Polygone für rechteckige Bereiche und nicht für komplexe Bereiche erstellt.

Der zweite Ansatz - von mehreren Kollegen vorgeschlagen - war Kriging. Ich hatte Kriging zunächst außer Kontrolle geraten, weil ich es immer nur für kontinuierliche Daten in Betracht gezogen habe. Die Herausforderung beim Kriging besteht darin, dass es auch nicht für kategoriale Daten ausgelegt ist. Jetzt beschäftige ich mich mit Cokriging mit Tiefe und Beschaffenheit der Oberfläche, aber bei jeder Art von Kriging werden ganzzahlige numerische Codes für die Beschaffenheit der Oberfläche verwendet. Danach müssen die resultierenden numerischen Gleitkomma-Codes wieder auf die ursprüngliche Ganzzahl-Codierung reduziert werden. Nicht hübsch.

Kann jemand andere Zeilen vorschlagen, denen er folgen soll? (Man könnte vielleicht eine Geländeanalyse verwenden. Zum Beispiel könnten Hänge, die steiler als der Ruhewinkel sind, keine Sedimente sein. Ich suche etwas Einfacheres und habe jedenfalls keine Daten mit ausreichender räumlicher Auflösung.)

Grüße,

— Doug Hrynyk
quelle

Der entsprechend umgesetzte Kriging-Ansatz ist vielversprechend.

Betrachten Sie als Ausgangspunkt die von Diggle & Ribeiro in Model-based Geostatistics (Springer 2007) beschriebenen "verallgemeinerten linearen geostatistischen Modelle" . Die zugrunde liegende Idee ist ansprechend und flexibel: Ein räumlich stochastischer Prozess (der räumlich kontinuierlich ist ) bestimmt die verschiedenen Wahrscheinlichkeiten der Kategorien. Man verwendet die beobachteten Kategorien an unregelmäßigen Punkten, um statistische Eigenschaften dieses zugrunde liegenden Prozesses einschließlich seiner räumlichen Korrelationsstruktur (Variogramm) abzuleiten. Kriging erzeugt dann eine Wahrscheinlichkeitsfläche, die mit den Beobachtungen übereinstimmt. An diesem Punkt können Sie geostatistische Simulationen durchführen oder Karten erstellen, die sich auf die Wahrscheinlichkeiten beziehen (z. B. Karten der Maximalwahrscheinlichkeitskategorien, wie ich mir vorstellen kann).

Das klingt raffiniert und ist es auch. Die Diskussion von Diggle und Ribeiro ist jedoch ziemlich zugänglich - obwohl sie mathematisch ist und einige statistische Kenntnisse voraussetzt, hängt sie auch nicht stark davon ab - und die meisten ihrer Techniken sind in R-Paketen implementiert, die sie beschreiben, geoRund geoRGLM. In der Tat ist es fair, dieses Buch als Handbuch für diese Pakete zu interpretieren.

Wie andere Threads auf dieser Site bestätigen, ist es relativ einfach, R mit GIS-Daten (einschließlich Shapefile und verschiedenen Rasterformaten) zu verbinden, sodass dies kein Problem darstellt.

— whuber
quelle