Computerwissenschaften computer-vision

5

Was ist der Unterschied zwischen Objekterkennung, semantischer Segmentierung und Lokalisierung?

Ich habe diese Wörter in ziemlich vielen Veröffentlichungen gelesen und möchte einige schöne Definitionen für diese Begriffe haben, die deutlich machen, was der Unterschied zwischen Objekterkennung und semantischer Segmentierung und Lokalisierung ist. Es wäre schön, wenn Sie Quellen für Ihre Definitionen angeben könnten.

23 terminology computer-vision

3

Was sind die Unterschiede zwischen Computer Vision und Bildverarbeitung?

Was sind die Unterschiede zwischen Computer Vision und Bildverarbeitung? Welche Rolle spielen beispielsweise Computer Vision und Bildverarbeitung bei der Objekterkennung?

17 terminology computer-vision image-processing education

1

Google DeepDream ausgearbeitet

Ich habe auf dieser Site einige Fragen zu Deep Dream gesehen, aber keine von ihnen scheint tatsächlich darüber zu sprechen, was DeepDream speziell tut. Soweit ich festgestellt habe, scheinen sie die Zielfunktion und auch die Backpropagation geändert zu haben, sodass sie das Eingabebild aktualisieren, anstatt die Gewichte zu aktualisieren. Ich …

12 machine-learning artificial-intelligence neural-networks image-processing computer-vision

1

Ableiten der Sobel-Gleichungen aus Ableitungen

Viele Sites geben die Sobel-Operatoren als Faltungsmaske zum Glätten eines Bildes an. Ich habe jedoch keine einzige Site gefunden, die beschreibt, wie Sie die Operatoren aus partiellen ersten Ableitungen ableiten können. Wenn jemand die Ableitung erklären kann, würde ich es sehr schätzen.

10 image-processing computer-vision

3

Intuition zur Faltung in der Bildverarbeitung

Ich habe viele Dokumente über die Faltung in der Bildverarbeitung gelesen , und die meisten von ihnen sagen über die Formel einige zusätzliche Parameter aus. Niemand erklärt die Intuition und die wahre Bedeutung, die hinter der Faltung eines Bildes stehen. Die Intuition der Ableitung im Diagramm macht es beispielsweise linearer. …

9 terminology intuition graphics computer-vision

1

Computer Vision: Objekterkennung mit Beschriftungen, die einzelne Koordinaten sind

Gibt es in der Literatur Artikel, die sich mit der folgenden Objekterkennungsaufgabe befassen? Die Aufgabe kann wie folgt beschrieben werden: Bei einer Reihe von Bildern sind die Beschriftungen nur Koordinaten (x, y), die die Objektpositionen darstellen, die wir erkennen möchten. Eine Koordinate befindet sich nicht unbedingt in der Mitte des …

7 machine-learning image-processing computer-vision data-mining

1

Computer Vision: Warum verhalten sich Zufallsfilter ähnlich wie Kantendetektoren?

Ich habe hier gelesen , dass "ein zufällig initialisierter Filter sehr ähnlich wie ein Kantendetektor wirkt!". Ich möchte wissen, ob es Papiere gibt, die dieses Phänomen beschreiben und erklären.

7 machine-learning computer-vision

1

Was ist der Unterschied zwischen "Merkmalen" und "Deskriptoren" in der Bildverarbeitung / im maschinellen Lernen?

Ich habe mehrere Zeitsätze ähnlich wie gelesen Schließlich wurden für die Standardbildklassifizierung Bag-of-Word-Merkmale, die auf SIFT-Deskriptoren basieren, als kritisch für hohe Leistungen befunden. Wir berechnen zunächst einen Standard-SIFT-Diskriptor an regelmäßigen Rasterpunkten über das gesamte Bild. Quelle: "Mehrklassen-Bildsegmentierung unter Verwendung bedingter Zufallsfelder und globaler Klassifizierung" von Nils Plath, Marc Toussaint, Shinichi …

7 machine-learning computer-vision features

2

Automatisiertes Lippenlesen: Ableiten, was jemand sagt, basierend auf dem Video, in dem er spricht

Einige Menschen können ziemlich gut Lippen lesen: Indem sie jemanden beobachten, der spricht, können sie sagen, was der Sprecher sagt (auch ohne die Rede zu hören). Wurde daran gearbeitet, Computersoftware zum Lippenlesen zu erstellen? Mit anderen Worten, ist es bei einem Video von jemandem, der spricht, möglich, Software zu erstellen, …

7 reference-request computer-vision pattern-recognition facial-recognition

3

Shannons Entropie für ein Bild

Shannons Entropie [Plog (1 / p)] für ein Bild ist eine probabilistische Methode zum Vergleichen von zwei Pixeln oder einer Gruppe von Pixeln. Angenommen, ein Bild mit einer Matrix von 3 × 3 hat Pixelintensitätswerte 1 1 2 2 3 3 4 4 5 und ein anderes Bild mit einer …

7 pattern-recognition image-processing entropy computer-vision

Als «computer-vision» getaggte Fragen