Ich versuche eine Methode zu finden, um Leute mit nur einer Kamera 3 Meter über dem Boden zu erkennen. Dies ist ein von der Kamera zurückgegebener Frame:
UPDATE: Videotest -> http://dl.dropbox.com/u/5576334/top_head_shadow.avi
Dazu verstehe ich zunächst, dass ich eine Hintergrund-Vordergrund-Segmentierung durchführen muss. Das ist der einfache Teil.
Mit der Vordergrundmaske kann ich einfache Operationen wie die Hough-Transformation ausführen, um Kreise zu finden. Auf diese Weise werden jedoch nur 60% der Köpfe erkannt, einschließlich vieler falsch positiver Ergebnisse.
Ich könnte einige andere einfache Techniken wie die Farbsegmentierung verwenden, aber ich fand heraus, dass die Köpfe der Menschen von oben gesehen sehr unterschiedlich sind, aufgrund ihrer Frisur, Farbe, Haarmenge, ...
Eine andere Möglichkeit, die ich habe, ist die Möglichkeit, HOG-Deskriptoren oder Haar-ähnliche Funktionen zu verwenden, aber ich würde eine umfangreiche Datenbank von Personen benötigen, die von oben gesehen werden, um die Modelle zu trainieren. Ich habe so etwas nicht gefunden.
Ich dachte, dies wäre ein sehr häufiges Problem, aber ich kann nicht viel darüber in der Literatur oder im Internet finden. Jede Hilfe zur Lösung dieser Aufgabe wird gebeten :-)
UPDATE: Weitere Informationen erhalten Sie, wenn Sie eine generische Methode zum Verfolgen des Fußgängerflusses implementieren. Der erste Prototyp wird in einer Mall getestet.