Die durchschnittliche Steigung klingt nach einer natürlichen Größe, ist aber eher seltsam. Zum Beispiel ist die durchschnittliche Steigung einer flachen horizontalen Ebene Null, aber wenn Sie einem DEM dieser Ebene ein kleines Stück zufälliges, durchschnittliches Rauschen von Null hinzufügen, kann die durchschnittliche Steigung nur steigen . Andere seltsame Verhaltensweisen sind die Abhängigkeit der durchschnittlichen Steigung von der DEM-Auflösung, die ich hier dokumentiert habe , und ihre Abhängigkeit davon, wie das DEM erstellt wurde. Zum Beispiel sind einige DEMs, die aus Konturkarten erstellt wurden, tatsächlich leicht terrassiert - mit winzigen abrupten Sprüngen, wo die Konturlinien liegen -, aber ansonsten sind sie genaue Darstellungen der Oberfläche insgesamt. Diese abrupten Sprünge können die durchschnittliche Steigung ändern, wenn sie im Mittelungsprozess zu viel oder zu wenig Gewicht erhalten.
Das Anheben der Gewichtung ist relevant, da tatsächlich ein harmonisches Mittel (und andere Mittel) die Steigungen unterschiedlich gewichten. Um dies zu verstehen, betrachten Sie das harmonische Mittel von nur zwei positiven Zahlen x und y . Per Definition,
Harmonic mean(x,y) = 1 / ((1/x + 1/y)/2) = x (y/(x+y)) + y (x/(x+y)) = a x + b y
wobei die Gewichte a = y / (x + y) und b = x / (x + y) sind. (Diese verdienen es, "Gewichte" genannt zu werden, weil sie positiv sind und sich zu Eins summieren. Für das arithmetische Mittel sind die Gewichte a = 1/2 und b = 1/2). Offensichtlich ist das an x gebundene Gewicht gleich y / (x + y) groß, wenn x im Vergleich zu y klein ist . Harmonisch bedeutet also, die kleineren Werte zu übergewichten.
Es kann hilfreich sein, die Frage zu erweitern. Das harmonische Mittel gehört zu einer Familie von Durchschnittswerten, die durch einen reellen Wert p parametrisiert sind . So wie das harmonische Mittel erhalten wird, indem die Kehrwerte von x und y gemittelt werden (und dann der Kehrwert ihres Durchschnitts genommen wird), können wir im Allgemeinen die p-ten Potenzen von x und y mitteln (und dann die 1 / p-te Potenz des Ergebnisses nehmen ). Die Fälle p = 1 und p = -1 sind das arithmetische bzw. das harmonische Mittel. (Wir können einen Mittelwert für p = 0 definieren, indem wir Grenzen setzen und dadurch auch als Mitglied dieser Familie den geometrischen Mittelwert erhalten.) Als pnimmt von 1 ab, die kleineren Werte werden immer stärker gewichtet; und wenn p von 1 ansteigt, werden die größeren Werte immer stärker gewichtet. Daraus folgt, dass der Mittelwert nur mit zunehmendem p zunehmen kann und mit abnehmendem p abnehmen muss. (Dies ist in der zweiten Abbildung unten ersichtlich, in der alle drei Linien entweder flach sind oder von links nach rechts zunehmen.)
Aus praktischer Sicht könnten wir stattdessen das Verhalten verschiedener Steigungsmittel untersuchen und dieses Wissen in unsere analytische Toolbox aufnehmen: Wenn wir erwarten, dass Steigungen eine Beziehung eingehen, so dass kleinere Steigungen stärker berücksichtigt werden sollten als Einfluss könnten wir einen Mittelwert mit p kleiner als 1 wählen ; und umgekehrt könnten wir p über 1 erhöhen, um die größten Steigungen hervorzuheben. Betrachten wir zu diesem Zweck verschiedene Formen von Entwässerungsprofilen in der Nähe eines Punktes.
Um zu zeigen, was vor sich gehen könnte, habe ich drei qualitativ unterschiedliche lokale Gebiete betrachtet : Zum einen sind alle Hänge gleich (was eine gute Referenz darstellt); Ein anderer ist, wo wir uns lokal am Boden einer Schüssel befinden: Um uns herum sind die Hänge Null, nehmen dann aber allmählich zu und werden schließlich um den Rand willkürlich groß. Die Umkehrung dieser Situation tritt auf, wenn nahegelegene Hänge mäßig sind, sich dann aber von uns abflachen. Das scheint ein realistisch breites Spektrum von Verhaltensweisen abzudecken.
Hier sind Pseudo-3D-Diagramme dieser drei Arten von Entwässerungsformen:
Hier habe ich die mittlere Steigung von jedem - mit der gleichen Farbcodierung - als Funktion von p berechnet , wobei p im Bereich von -1 (harmonischer Mittelwert) bis 2 liegt.
Natürlich ist die blaue Linie horizontal: Unabhängig davon, welchen Wert p annimmt, kann der Mittelwert einer konstanten Steigung nichts anderes als diese Konstante sein (die als Referenz auf 1 gesetzt wurde). Die hohen Steigungen am äußersten Rand der roten Schale beeinflussen die mittleren Steigungen stark, wenn p variiert: Beachten Sie, wie groß sie werden, sobald p 1 überschreitet. Der horizontale Rand in der dritten (goldgrünen) Oberfläche verursacht das harmonische Mittel (p = - 1) Null sein.
Es ist bemerkenswert, dass sich die relativen Positionen der drei Kurven bei p = 0 (dem geometrischen Mittelwert) ändern: Für p größer als 0 hat die rote Schale größere durchschnittliche Steigungen als die blaue, während für negatives p die rote Schale einen kleineren Durchschnitt hat Hänge als das Blau. Somit kann Ihre Wahl von p sogar die relative Rangfolge der durchschnittlichen Steigungen ändern .
Die tiefgreifende Auswirkung des harmonischen Mittels (p = -1) auf die gelbgrüne Form sollte uns eine Pause geben: Es zeigt, dass das harmonische Mittel so klein sein kann, dass es jeden Einfluss von überwältigt , wenn genügend kleine Steigungen in der Entwässerung vorhanden sind alle anderen Pisten.
Im Sinne einer explorativen Datenanalyse können Sie eine Variation von p in Betracht ziehen - möglicherweise einen Bereich von 0 bis etwas größer als 1, um extreme Gewichte zu vermeiden - und herausfinden, welcher Wert die beste Beziehung zwischen der mittleren Steigung und der von Ihnen verwendeten Variablen herstellt modellieren (z. B. Schwellenwerte für die Kanalinitialisierung). "Am besten" wird normalerweise im Sinne von "am linearsten" oder "konstante [homoskedastische] Residuen" in einem Regressionsmodell verstanden.