Was ist der Unterschied zwischen einem Empfangsfeld und einer Feature-Map?


9

In einem CNN ist das Empfangsfeld der Teil des Bildes, der zur Berechnung der Filterausgabe verwendet wird. Die Ausgabe eines Filters (die auch als "Feature Map" bezeichnet wird) ist jedoch die Eingabe des nächsten Filters.

Was ist der Unterschied zwischen einem Empfangsfeld und einer Feature-Map?

Antworten:


4

Empfangsfeld

Das Rezeptionsfeld ist im Kontext der CNN-Mechanik der diskrete Eingabebereich, der als Eingabe für den Faltungskern einer bestimmten Schicht ausgewählt wird. Die Reichweite eines Empfangsfeldes ist eine Funktion sowohl der Position als auch der Größe. Der Bereich gilt für eine oder mehrere Dimensionen. 1

  • Horizontal
  • Vertikale
  • Rahmenindex
  • Zeitinkrement
  • Pixel-Layer-Index
  • Andere Abmessungen

Die Position des Empfangsfeldes wird systematisch variiert, um eine Teilmenge des Indexbereichs in jeder Dimension auszuwählen, um den gesamten Bereich abzudecken. 2 Die Größe ist an die Eingabe des darauf arbeitenden Kernels angepasst und daher normalerweise konstant. 3

Dies sind die drei bestimmenden Merkmale von Empfangsfeldern in CNNs.

  • Gibt den Bereich der Indizes an, die für die Eingabe in den Faltungskern in Bezug auf Indexposition und -größe ausgewählt wurden
  • Die Größe des Indexbereichs in jeder Dimension (normalerweise ungerade und kleiner als 20) stimmte mit den Eigenschaften der Kernel-Eingabegröße überein
  • Die Position des Indexbereichs in jeder Dimension wird systematisch variiert, um den gesamten Informationsbereich in allen Dimensionen abzudecken, normalerweise in festen Schritten

Es ist zu beachten, dass der Begriff Empfangsfeld aus den Grenzen der Signaldarstellung des in biologischen Systemen erfassten Gesichtsfelds stammt. In diesem Zusammenhang bezieht sich der Begriff Empfangsfeld auf den geometrischen Bereich, der durch Bildgebungsgeräte oder Organe erfasst wird. So wie ein Auge eine Landschaft scannen kann, erfolgt die Auswahl einer Position innerhalb des gesamten Informationsfeldes im CNN-Design.

Die Gemeinsamkeit zwischen dem Biologischen und dem Künstlichen besteht darin, den Fokus der Aufmerksamkeit über den gesamten Sinnesraum zu variieren.

Feature Map als Darstellung extrahierter Features

Der Begriff Feature Map ist in diesem Zusammenhang eine Map, die die Features darstellt, die durch eine oder mehrere Faltungsebenen extrahiert wurden. Der Begriff kann für die Zwischenausgabe von Kerneln ungenau verwendet werden. Beachten Sie jedoch, dass die Ausgabe von Zwischenschichten vor gepoolten Schichten noch keine direkten Merkmale darstellt. In diesen Phasen ist die Extraktion unvollständig, sodass keine direkte Beziehung zwischen Werten und Merkmalen besteht.

Der Begriff Feature-Map wird am genauesten verwendet, wenn die Ausgabe der letzten Pooling-Schicht in einem Abschnitt von CNN-Schichten beschrieben wird. Dieser Abschnitt kann innerhalb einer Folge von CNN-Abschnitten liegen oder auf andere Weise Komponenten in einer größeren Systemarchitektur sein.

Beispiele für Feature-Zuordnungen sind diese.

  • Kanten
  • Erscheinen oder Verschwinden (zeitlicher Bereich)
  • Objektelemente
  • Bewegungsbahn
  • Zoomen
  • Objekte
  • Aktionen

Bei dieser Verwendung des Begriffs bezieht sich die Zuordnung von Merkmalen auf die Dimensionen der Informationen, den Positionsraum, auf den der Kernel angewendet wurde.

Feature Map als Darstellung einer Transformation im diskreten Hilbert-Raum

Wenn der Begriff Feature Map auf die Zuordnung angewendet wird, die von einem oder mehreren CNN-Layern ausgeführt wird, werden die Features am Ausgang dem Eingang und nicht den Positionen zugeordnet. In diesem Zusammenhang ist das Mapping die Tensor-Transformation im Hilbert-Raum. Beachten Sie, dass die Karte keine Darstellung des Signals ist, sondern die Darstellung der Transformation, des Kernels und seiner gelernten Parameter in ihrem aktuellen Zustand.

Um diesen Kontext vom vorherigen zu unterscheiden, kann es nützlich sein, den Begriff Feature Mapping zu verwenden, um eine Tensortransformation anstelle der Ausgabe einer solchen Transformation anzuzeigen.

Überschneidung der Bedingungen

Wenn die Ausgabe eines Faltungsabschnitts eine Karte von Merkmalen enthält und in eine andere Faltungsschicht oder einen anderen Abschnitt eingespeist wird, wird die Merkmalskarte eines Abschnitts zum vollständigen Raum, über den das Empfangsfeld die Teilmenge von Informationen auswählt, die in den nächsten Kernel als eingespeist werden sollen Eingang.

Beachten Sie, dass eine Feature-Map ein vollständiges Signal ist, das alle Daten in ihrem Abschnitt des Netzwerks darstellt, wobei ein Empfangsfeld meistens eine Teilmenge des vollständigen Signals ist, das mehrmals angewendet wird, um die gesamte Signalbreite in mehreren Dimensionen abzudecken.

Die beiden Begriffe sind in keinem Zusammenhang synonym, sondern lediglich durch Theorie und Praxis verbunden.

Fußnoten

nInn1

[2] Die Auswahl von Bereichen innerhalb jeder Dimension kann durch Schleifen in Algorithmen oder durch Hardwarelösungen erfolgen, die Fensteroperationen mit DSP- oder GPU-Schaltungen ausführen, möglicherweise über Hardware- oder Firmware-gesteuerte parallele RISC-Operationen.

[3] Beispiel- und Epochenindizes können in einigen CNN-Designs ähnlich begrenzt werden, aber solche Indizes werden im üblichen Sinne des Wortes nicht als Teil von Rezeptionsfeldern betrachtet. Nur die Abmessungen in jedem Beispiel sind. Außerdem werden Eingabestreamindizes, wie z. B. die Kamera-ID, normalerweise nicht als Dimension in einem Empfangsfeld enthalten.


3

Ich hoffe, diese Illustration wird Ihnen helfen:

Empfangsfeld (e) : ist ein kleiner Teil der Eingabe, um nur einen Knoten in einer Feature-Map zu erzeugen .

Feature-Map (s) : Ist eine Faltungsprozessausgabe. Eine Feature-Map kann als Feature-Darstellung der Filtereingabe bezeichnet werden. Eine Feature-Map besteht aus vielen Filterausgaben (aus verschiedenen Empfangsfeldern) eines Kernels. Die Anzahl der Feature-Maps hängt von der Anzahl des Kernels ab.

Selbst Feature-Maps sind also die Eingabe des nächsten Filters, aber die nächsten Empfangsfelder sind keine Feature-Map. Das nächste Empfangsfeld besteht aus einem kleinen Teilknoten aus verschiedenen Merkmalskarten (nicht nur einer Merkmalskarte).

(46×46)(5×5×Number Of Feature Maps)

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.