Ich habe mich mit Algorithmen zur Markererkennung befasst, die mit einer Kinect-basierten Anwendung verwendet werden können, und der Großteil der Arbeit, die ich finden konnte, konzentriert sich offensichtlich auf die Erkennung von Merkmalen in "normalen" Bildern.
Die Kinect-Hardware bietet jedoch (im Wesentlichen nach dem Anpassen) einen 11-Bit-Tiefenwert pro Pixel.
Dieses Tiefenbild enthält auch verschiedene visuelle Artefakte aus den Schatten, die um die Kanten von Objekten geworfen werden (siehe zum Beispiel den starken schwarzen Rand in diesem Video http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).
Während einige traditionelle Bildverarbeitungstechniken (z. B. Kantenerkennung) damit gut funktionieren, funktionieren andere nicht, und es scheint, dass es im Internet nur wenige Informationen gibt, die dies diskutieren.
Die Verwendung des Tiefenwerts macht es beispielsweise einfach, die Ausrichtung eines Markierungsblocks zu ermitteln, sobald Sie ihn gefunden haben.
Hat jemand Diskussionen / Papiere / etc. gesehen, die die Verarbeitung eines Tiefenbildes zur Merkmalserkennung abdecken?
Kann jemand einen guten Algorithmus zum Erkennen von "Tiefen" -Markierungen empfehlen (effektiv Origami-Blöcke anstelle von gedruckten s / w-Markierungen)?
Was ich bisher gemacht habe, waren Ad-hoc-Experimente mit opencv, um die Bilder zu verarbeiten, aber das ist bei weitem nicht stabil oder schnell genug.
Wenn Sie ohne Testversion eine Verknüpfung zu einem kommerziellen Bildverarbeitungsprodukt herstellen, geben Sie in Ihrer Antwort an, warum Sie dies für angemessen halten.