Ich versuche den Faltungsteil von neuronalen Faltungsnetzen zu verstehen. Betrachten Sie die folgende Abbildung:
Ich habe keine Probleme, die erste Faltungsschicht zu verstehen, in der wir 4 verschiedene Kernel (mit der Größe ) haben, die wir mit dem Eingabebild falten, um 4 Merkmalskarten zu erhalten.
Was ich nicht verstehe, ist die nächste Faltungsschicht, in der wir von 4 Feature-Maps zu 6 Feature-Maps wechseln. Ich nehme an, wir haben 6 Kernel in diesem Layer (was folglich 6 Ausgabe-Feature-Maps ergibt), aber wie funktionieren diese Kernel auf den 4 in C1 gezeigten Feature-Maps? Sind die Kernel dreidimensional oder zweidimensional und werden sie auf den vier Eingabe-Feature-Maps repliziert?