Anzahl der Merkmalskarten in neuronalen Faltungsnetzen


16

Beim Erlernen des neuronalen Faltungsnetzwerks habe ich Fragen zu der folgenden Abbildung.

1) C1 in Layer 1 hat 6 Feature-Maps. Bedeutet das, dass es sechs Faltungskerne gibt? Jeder Faltungskernel wird verwendet, um eine Feature-Map auf der Grundlage von Eingaben zu generieren.

2) S1 in Schicht 2 hat 6 Merkmalskarten, C2 hat 16 Merkmalskarten. Wie sieht der Prozess aus, um diese 16 Feature-Maps basierend auf 6 Feature-Maps in S1 zu erhalten?

Bildbeschreibung hier eingeben

Antworten:


13

1) C1 in Layer 1 hat 6 Feature-Maps. Bedeutet das, dass es sechs Faltungskerne gibt? Jeder Faltungskernel wird verwendet, um eine Feature-Map auf der Grundlage von Eingaben zu generieren.

Es gibt 6 Faltungskerne, von denen jeder zum Generieren einer Feature-Map auf der Grundlage von Eingaben verwendet wird. Eine andere Art zu sagen ist, dass es 6 Filter oder 3D-Sätze von Gewichten gibt, die ich nur Gewichte nennen werde. Was dieses Bild nicht zeigt, was es wahrscheinlich sollte, um es klarer zu machen, ist, dass Bilder normalerweise 3 Kanäle haben, z. B. Rot, Grün und Blau. Die Gewichte, die Sie von der Eingabe zu C1 abbilden, haben also die Form / Dimension 3x5x5 und nicht nur 5x5. Dieselben dreidimensionalen Gewichte oder Kernel werden auf das gesamte 3 × 32 × 32-Bild angewendet, um eine zweidimensionale Merkmalskarte in C1 zu generieren. In diesem Beispiel gibt es 6 Kernel (jeweils 3 x 5 x 5), sodass in diesem Beispiel 6 Feature-Maps erstellt werden (jeweils 28 x 28, da die Schrittweite 1 und der Abstand Null ist), von denen jeder das Ergebnis der Anwendung eines 3 x 5 x 5-Kernels auf die Eingabe ist.

2) S1 in Schicht 1 hat 6 Merkmalskarten, C2 in Schicht 2 hat 16 Merkmalskarten. Wie sieht der Prozess aus, um diese 16 Feature-Maps basierend auf 6 Feature-Maps in S1 zu erhalten?

Tun Sie jetzt dasselbe wie in Schicht 1, aber für Schicht 2, mit der Ausnahme, dass diesmal die Anzahl der Kanäle nicht 3 (RGB), sondern 6, sechs für die Anzahl der Feature-Maps / Filter in S1 beträgt. Es gibt jetzt 16 einzigartige Kernel mit den Abmessungen 6x5x5. Jeder Layer 2-Kernel wird auf ganz S1 angewendet, um eine 2D-Feature-Map in C2 zu generieren. Dies wird 16-mal für jeden einzelnen Kernel in Layer 2 (alle 16) durchgeführt, um die 16 Feature-Maps in Layer 2 zu generieren (jeweils 10 x 10, da Schrittweite 1 und Abstand Null sind).

Quelle: http://cs231n.github.io/convolutional-networks/

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.