In der Scale-Space - Theorie der Scale-Space - Darstellung des Signal , (im Fall von Bild d = 2 ) ist gegeben als: L ( x , y ; t ) = g ( x , y ; t ) ≤ f ( x , y ) wobei g ( x , ist ein Gaußscher Kern mit dem Parameter t und ∗ ist eine Faltung. Durch Ändern des t- Parameters erhalten wir ein mehr oder weniger geglättetes Bild. Infolgedessen enthält eine gröbere Darstellung (Parameter t ) keine kleinen Objekte oder Rauschen.
Der Hauptpunkt ist, einen Weg zur skaleninvarianten Merkmalserkennung zu finden, oder? Damit bei einigen Bildern mit verkleinerter Größe die Funktionen wie Schlüsselpunkte korrekt erkannt werden, auch wenn die Größe unterschiedlich ist, ohne dass andere Rauschschlüsselpunkte gefunden werden.
In der Arbeit verwenden sie die normalisierten Derivate. δ ξ , γ - n o r m = t γ / 2 δ x . Was bedeutet die Verwendung des γ- normalisierten Derivats, wie hilft es bei der Skaleninvarianz?
Auf diesem Bild können wir sehen, dass sich an nahezu denselben Positionen die verschiedenen Schlüsselpunkte befinden (unterschiedlich groß). Wie ist das möglich?
Das Papier, das ich gelesen habe, ist: Funktionserkennung mit automatischer Skalenauswahl