Objekterkennung versus Objekterkennung


8

Ich habe eine leichte Verwirrung zwischen Objekterkennung und Objekterkennung. Einige Leute sagen, Objekterkennung sei ein Unterthema der Objekterkennung? Kann jemand den Unterschied zwischen diesen beiden Themen klären?

Nach meinem besten Wissen:

Die Objekterkennung beantwortet die Frage "Was ist das Objekt im Bild", während die Objekterkennung die Frage "Wo ist das Objekt?" Beantwortet.

Hoffe, jemand kann den Unterschied veranschaulichen, indem er auch großzügig ein Beispiel für jeden liefert.


Diese Antwort kann helfen: stackoverflow.com/a/34691321/1546088
acgtyrant

Antworten:


11

Sie haben Ihre eigene Frage beantwortet.

Objekterkennung: Welches Objekt ist im Bild dargestellt?

  • Eingabe : Ein Bild mit unbekannten Objekten.

    Möglicherweise kann die Position des Objekts in der Eingabe markiert werden, oder die Eingabe ist möglicherweise nur ein klares Bild des (nicht verdeckten) Objekts.

  • Ausgabe : Position (en) und Beschriftung (en) (Namen) der Objekte im Bild

    Die Positionen von Objekten werden entweder von der Eingabe erfasst oder basierend auf dem Eingabebild bestimmt.

    Beim Beschriften von Objekten gibt es normalerweise eine Reihe von Kategorien / Beschriftungen, die das System "kennt" und zwischen denen das System unterscheiden kann (z. B. Objekt ist entweder Hund, Auto, Pferd, Kuh oder Vogel).

Objekterkennung: Wo befindet sich dieses Objekt im Bild?

  • Eingabe: ein klares Bild eines Objekts oder eine Art Modell eines Objekts (z. B. Ente) und ein Bild (möglicherweise), das das interessierende Objekt enthält

  • Ausgabe: Position oder ein Begrenzungsrahmen des Eingabeobjekts, falls es im Bild vorhanden ist (z. B. befindet sich die Ente in der oberen linken Ecke des Bildes)


0

Objekterkennungsbasis auf dem interessierenden Punkt eines gegebenen Bildes; Zum Beispiel sprach der Vogel in Bild und Erkennung über die spezifischen Informationen über den Vogel, wie Name, Typ und andere Merkmale von besonderem Interesse.


Können Sie diese Antwort bitte etwas näher erläutern, da nicht genau klar ist, wie sie die Frage beantwortet? Zumindest ist das meine Wahrnehmung.
A_A

Objekterkennung: In jedem Bild müssen Sie alle Objekte erkennen (eine eingeschränkte Objektklasse hängt von Ihrem Datensatz ab), sie mit einem Begrenzungsrahmen lokalisieren und diesen Begrenzungsrahmen mit einer Beschriftung kennzeichnen. Objekterkennung. Objekterkennung: Es ist wie bei der Objekterkennung, aber in dieser Aufgabe gibt es nur zwei Klassen von Objektklassifizierungen, dh Objektbegrenzungsrahmen und Nicht-Objektbegrenzungsrahmen. Zum Beispiel
Autoerkennung

Die Objekterkennung beantwortet die Frage "Was ist das Objekt im Bild?" Während die Objekterkennung die Frage "Wo ist das Objekt?" Beantwortet. Problem beim Abrufen von Bildern, dh das Problem der Suche nach digitalen Bildern in großen Datenbanken.
user35925

Danke, aber ich habe nicht persönlich nach mir gefragt. Die Antwort tauchte in meiner Überprüfungswarteschlange auf und ich dachte, dass es sich lohnen würde, sie ein wenig auf mehr zu erweitern, als Sie als Kommentar hätten hinterlassen können. Ein Antwortbeitrag ist normalerweise etwas aufwändiger. Alles Gute.
A_A

0

spät, aber hier ist die Antwort. Quelle: https://www.learnopencv.com/selective-search-for-object-detection-cpp-python/

Ein Objekterkennungsalgorithmus identifiziert, welche Objekte in einem Bild vorhanden sind. Es nimmt das gesamte Bild als Eingabe und gibt Klassenbeschriftungen und Klassenwahrscheinlichkeiten von Objekten aus, die in diesem Bild vorhanden sind. Beispielsweise könnte ein Klassenlabel "Hund" sein und die zugehörige Klassenwahrscheinlichkeit könnte 97% betragen.

Andererseits sagt Ihnen ein Objekterkennungsalgorithmus nicht nur, welche Objekte im Bild vorhanden sind, sondern gibt auch Begrenzungsrahmen (x, y, Breite, Höhe) aus, um die Position der Objekte im Bild anzuzeigen

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.