Eine (klare) Grenze zwischen Computer Vision und Bildverarbeitung


14

Ich arbeite und lerne seit ein paar Jahren sowohl im Bereich Computer Vision als auch im Bereich Bildverarbeitung und glaube, dass ich kein Anfänger mehr bin.

Trotzdem fällt es mir nach all den Jahren schwer, für einen bestimmten Teil meiner Arbeit zu sagen, ob es sich hauptsächlich um Computer Vision handelt oder ob es sich um Bildverarbeitung handelt . Ich kann die Zeile einfach nicht sehen - wenn ich arbeite, studiere und recherchiere, lese ich Referenzmaterialien mit beiden Schlüsselwörtern.

Ich interessiere mich daher für die Definition der Bereiche Computer Vision und Bildverarbeitung, wobei der Vergleich (Unterschiede sowie Überlappungen) der Bereiche im Vordergrund steht .

Darüber hinaus halte ich es für nützlich, ein Beispiel für (konzeptionelle oder bestehende) praktische Anwendungen, Projekte und Arbeiten zu haben, die sich mit / unter Verwendung von:

  • ausschließlich (oder überwiegend) Computer Vision-Tools und -Ideen
  • ausschließlich (oder überwiegend) Bildverarbeitungswerkzeuge und -ideen
  • eine Kombination von Werkzeugen und Ideen aus beiden Bereichen

mit besonderem Augenmerk darauf, was macht es das eine und nicht das andere , oder was macht es beide .

Ich verstehe, dass diese Felder eng miteinander verwandt sind und dass die "Linie" möglicherweise nicht so klar ist, wie in dieser Frage gefordert, aber ich hoffe, Sie verstehen, dass es bei dieser Frage nicht darum ging, eine einfache Entscheidungsregel für die Klassifizierung (meiner) zu entwerfen. Arbeit, sondern ein besseres Verständnis der Schwerpunkte und Ziele dieser Bereiche. Außerdem sind alle zusätzlichen Informationen, die mit meinem Fragenton zu tun scheinen, willkommen, auch wenn ich nicht ausdrücklich darum gebeten habe.


Was ist mit "Machine Vision"? Sehen Sie es als Synonym für "Computer Vision"?
Alessandro Jacopson

@uvts_cvs Um ehrlich zu sein, habe ich nie über "Machine Vision" unterrichtet ... Vielleicht hat das eine Bedeutung von "Maschinen (mit eingebetteten Systemen), die darauf spezialisiert sind, Computer Vision-Aufgaben auszuführen", z. B. habe ich einmal über Kameras gelesen, die Lizenzen erkennen können Platten. Aber
andererseits

Antworten:


12

Ich glaube Gonzalez und Woods sind kompetent genug, um sich auf ihre Meinung zu verlassen:

Die Autoren sind sich nicht einig, wo die Bildverarbeitung und andere verwandte Bereiche wie Bildanalyse und Computer Vision beginnen. Manchmal wird eine Unterscheidung getroffen, indem die Bildverarbeitung als eine Disziplin definiert wird, in der sowohl die Eingabe als auch die Ausgabe eines Prozesses Bilder sind. Wir glauben , dass dies eine einschränkende und etwas künstliche Grenze ist . Beispielsweise würde nach dieser Definition selbst die triviale Aufgabe der Berechnung der durchschnittlichen Intensität eines Bildes (die eine einzelne Zahl ergibt) nicht als Bildverarbeitungsoperation angesehen. Zum anderen gibt es Felder wie Computer Vision, deren letztendliches Ziel es ist, Computer zu verwenden, um das menschliche Sehen zu emulieren, einschließlich des Lernens und der Fähigkeit, aufgrund visueller Eingaben Schlussfolgerungen zu ziehen und Maßnahmen zu ergreifen. Dieser Bereich selbst ist ein Zweig der künstlichen Intelligenz (KI), dessen Ziel es ist, die menschliche Intelligenz zu emulieren. Das Gebiet der KI befindet sich in Bezug auf die Entwicklung noch in den Kinderschuhen, wobei die Fortschritte viel langsamer waren als ursprünglich angenommen. Der Bereich der Bildanalyse (auch Bildverständnis genannt) liegt zwischen Bildverarbeitung und Computer Vision .

Ich würde also sagen, dass der Hauptunterschied in den Zielen liegt, nicht in den Methoden. Wenn beispielsweise das Ziel darin besteht, das Bild für die spätere Verwendung durch Menschen zu verbessern , kann dies als Bildverarbeitung bezeichnet werden. Und wenn das Ziel darin besteht, das menschliche Sehen nachzubilden (sei es die Erkennung von Objekten, die Erkennung von Fehlern oder das automatische Fahren), dann ist es der Computersicht näher. Beachten Sie jedoch, dass die Emulation des menschlichen Sehens per Definition auch eine Bildverbesserung erfordern kann. In den meisten realen Fällen ist das Computer-Sehen daher auf die Bildverarbeitung angewiesen .

Das Bildverständnis (Merkmalsextraktion) kann gleichermaßen in der reinen Bildverarbeitung und in der Computersicht verwendet werden.


Gute Punkte ..
Spacey

sehr nette antwort. Genau das richtige Verhältnis von Referenzmaterial und Interpretation aus Erfahrung. Danke
Penelope

10

So wie ich es verstehe, ist das Ziel der Bildverarbeitung, ein (irgendwie transformiertes) Bild zu erhalten. Das Ziel von Computer Vision ist es, etwas über die Dinge auf dem Bild herauszufinden (wie ist der Typ auf dem Bild glücklich oder traurig, wie viele Autos gibt es auf dem Bild und wie fahren sie).

ausschließlich (oder überwiegend) Computer Vision-Tools und -Ideen

Ich denke nicht, dass das möglich ist, nicht so, wie ich die Begriffe verstehe.

ausschließlich (oder überwiegend) Bildverarbeitungswerkzeuge und -ideen

Nehmen Sie zum Beispiel Adobe Photoshop: Es kann ein Bild aufnehmen und es in ein Bild einer schlankeren Person mit besserer Haut verwandeln. Es "weiß" jedoch nichts über die im Bild dargestellten Objekte.


Lassen Sie mich ein Beispiel geben: Ich arbeite derzeit an der inhaltsbasierten Bildsuche. Die meisten Leute bestehen darauf, dass Bildverarbeitung. Ich bin nicht sicher, ob es zu Ihrer Antwort passt (ohne zu sagen, dass es eine schlechte Antwort ist, ich frage mich nur)
Penelope

Ein Indikator ist: Ist das Ergebnis Ihrer Aufgabe ein Bild (IP) oder eine andere Datenstruktur (CV). In CBIR ist das Ergebnis eine andere Datenstruktur (z. B. ein Ähnlichkeitsmaß zwischen Bildern), also würde ich sagen, es ist Computer Vision. Wikipedia sagt, es ist auch Computer Vision.
Niki Estner

Dort habe ich mich jetzt selbst gegoogelt, und ich habe diesen Übersichtsartikel gefunden und zitiere: "In diesen Systemen werden Bildverarbeitungsalgorithmen (normalerweise automatisch) verwendet, um Merkmalsvektoren zu extrahieren, die Bildeigenschaften wie Farbe, Textur und Form. " Artikel sieht ziemlich solide für mich ...
Penelope

2
Ja, jedes Computer Vision System verwendet Bildverarbeitungsalgorithmen.
Niki Estner

Ich bin mit keinem bestimmten Punkt in Ihrer Antwort und / oder Ihren Erklärungen einverstanden. Es passt einfach nicht so gut hinein, wie ich es gerne hätte. Aber das wird zu einer Diskussion, und das ist kontraproduktiv. Also, ich hoffe nur, dass es andere Beiträge zu der Frage geben wird, die hoffentlich eine andere / klarere Perspektive
bieten
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.