Als Ergänzung zu Penelopes Antwort zwei beliebte Familien (und trendige) von Algorithmen.
Superpixel
Eine sehr beliebte Familie von Algorithmen namens Superpixel ist derzeit sehr im Trend (es gibt sogar einige Superpixel-Sitzungen in CV-Konferenzen). Superpixel ähneln stark einer Über-Segmentierung (wie es die Wasserscheide bietet), daher ist eine Nachbearbeitung erforderlich.
Superpixel können als kleine homogene Bildbereiche angesehen werden . Der Abstand zwischen Pixeln wird wie bei der bilateralen Filterung ausgewertet, dh es ist eine Mischung zwischen ihrem räumlichen Abstand und ihrer visuellen Ähnlichkeit, die auf 0 geht, wenn sie nahe und ähnlich sind, und ansonsten auf einen größeren Wert.
Dann versuchen Superpixel-Verfahren verschiedene Kriterien, um kleine homogene Regionen in Bezug auf dieses Maß zu bilden. Es gibt viele davon (grafisch, modussuchend / clusterbasiert ...), daher ist es wahrscheinlich am besten, Sie auf diesen technischen Bericht zu verweisen .
(Bearbeiten :) Falls jemand nach einer veröffentlichten, von Experten geprüften Arbeit sucht, stammt dieser Artikel von denselben Autoren und behandelt dasselbe Material wie der technische Bericht:
R. Achanta, A. Shaji, K. Smith, A. Lucchi, P. Fua, S. Susstrunk: SLIC-Superpixel im Vergleich zu hochmodernen Superpixel-Methoden
Beachten Sie, als ich die erste Version der Antwort schrieb, dass die Ergebnisse visuell sehr ähnlich zu denen sind, die Ihnen die Übersegmentierung von Wassereinzugsgebieten bietet. Dies wird von den Autoren des technischen Berichts bestätigt, die Wassereinzugsgebiete in den entsprechenden Arbeitsteil aufnehmen. Daher müssen Sie auch die gleiche Nachbearbeitung durchführen: Während Superpixel nützliche Funktionen anstelle von Pixeln sein können, müssen sie dennoch gruppiert werden, um übergeordnete Regionen zu bilden, wenn Sie Objekte verfolgen / erkennen müssen.
Graphbasierte Segmentierungsmethoden
Eine weitere beliebte Familie von Algorithmen stammt aus der Analyse der Pixelbeziehung, dh wie Pixel in ihrem Erscheinungsbild nahe beieinander liegen. Dies ergibt eine graphentheoretische Familie von Segmentierungsmethoden wie den normalisierten Schnitt (J. Shi, J. Malik: Normalisierte Schnitte und Bildsegmentierung ) .
Hier ist die Intuition für diesen Ansatz: Angenommen, Ihre Pixel sind jetzt Punkte (Eckpunkte) eines hochdimensionalen Graphen.
In der Grafik können zwei Scheitelpunkte durch eine Kante verbunden werden , deren Gewicht umgekehrt proportional zu einem gewissen Abstand zwischen den Scheitelpunkten ist. Typischerweise ist die Gewichtsfunktion ein Kehrwert einer Mischung zwischen ihrer räumlichen Entfernung und ihrer visuellen Ähnlichkeit (wie bei der bilateralen Filterung).
In diesem Diagramm können Segmentierungsalgorithmen dann nach den besten Scheitelpunktclustern suchen, dh nach Scheitelpunktgruppen mit einem kleinen gruppeninternen Abstand und einem großen zusätzlichen Gruppenabstand .
Beim Normalized Cut-Ansatz wird zusätzliche Sorgfalt angewendet, um Verzerrungen durch die unterschiedlichen Populationsgrößen der Cluster zu vermeiden. Darüber hinaus kann die Exploration von Graphen vermieden werden, indem die SVD der Gewichtsmatrix berechnet wird, die in der Graphentheorie auch als Konnektivitätsmatrix bezeichnet wird.