Ich habe diese Wörter in ziemlich vielen Veröffentlichungen gelesen und möchte einige schöne Definitionen für diese Begriffe haben, die deutlich machen, was der Unterschied zwischen Objekterkennung und semantischer Segmentierung und Lokalisierung ist. Es wäre schön, wenn Sie Quellen für Ihre Definitionen angeben könnten.
Was sind die Unterschiede zwischen Computer Vision und Bildverarbeitung? Welche Rolle spielen beispielsweise Computer Vision und Bildverarbeitung bei der Objekterkennung?
Ich habe auf dieser Site einige Fragen zu Deep Dream gesehen, aber keine von ihnen scheint tatsächlich darüber zu sprechen, was DeepDream speziell tut. Soweit ich festgestellt habe, scheinen sie die Zielfunktion und auch die Backpropagation geändert zu haben, sodass sie das Eingabebild aktualisieren, anstatt die Gewichte zu aktualisieren. Ich …
Viele Sites geben die Sobel-Operatoren als Faltungsmaske zum Glätten eines Bildes an. Ich habe jedoch keine einzige Site gefunden, die beschreibt, wie Sie die Operatoren aus partiellen ersten Ableitungen ableiten können. Wenn jemand die Ableitung erklären kann, würde ich es sehr schätzen.
Ich habe viele Dokumente über die Faltung in der Bildverarbeitung gelesen , und die meisten von ihnen sagen über die Formel einige zusätzliche Parameter aus. Niemand erklärt die Intuition und die wahre Bedeutung, die hinter der Faltung eines Bildes stehen. Die Intuition der Ableitung im Diagramm macht es beispielsweise linearer. …
Gibt es in der Literatur Artikel, die sich mit der folgenden Objekterkennungsaufgabe befassen? Die Aufgabe kann wie folgt beschrieben werden: Bei einer Reihe von Bildern sind die Beschriftungen nur Koordinaten (x, y), die die Objektpositionen darstellen, die wir erkennen möchten. Eine Koordinate befindet sich nicht unbedingt in der Mitte des …
Ich habe hier gelesen , dass "ein zufällig initialisierter Filter sehr ähnlich wie ein Kantendetektor wirkt!". Ich möchte wissen, ob es Papiere gibt, die dieses Phänomen beschreiben und erklären.
Ich habe mehrere Zeitsätze ähnlich wie gelesen Schließlich wurden für die Standardbildklassifizierung Bag-of-Word-Merkmale, die auf SIFT-Deskriptoren basieren, als kritisch für hohe Leistungen befunden. Wir berechnen zunächst einen Standard-SIFT-Diskriptor an regelmäßigen Rasterpunkten über das gesamte Bild. Quelle: "Mehrklassen-Bildsegmentierung unter Verwendung bedingter Zufallsfelder und globaler Klassifizierung" von Nils Plath, Marc Toussaint, Shinichi …
Einige Menschen können ziemlich gut Lippen lesen: Indem sie jemanden beobachten, der spricht, können sie sagen, was der Sprecher sagt (auch ohne die Rede zu hören). Wurde daran gearbeitet, Computersoftware zum Lippenlesen zu erstellen? Mit anderen Worten, ist es bei einem Video von jemandem, der spricht, möglich, Software zu erstellen, …
Shannons Entropie [Plog (1 / p)] für ein Bild ist eine probabilistische Methode zum Vergleichen von zwei Pixeln oder einer Gruppe von Pixeln. Angenommen, ein Bild mit einer Matrix von 3 × 3 hat Pixelintensitätswerte 1 1 2 2 3 3 4 4 5 und ein anderes Bild mit einer …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.