Die Vorspannung arbeitet pro virtuellem Neuron, sodass es keinen Wert hat, mehrere Vorspannungseingänge zu haben, wenn es nur einen Ausgang gibt - das würde bedeuten, nur die verschiedenen Vorspannungsgewichte zu einer einzigen Vorspannung zu addieren.
In den Feature-Maps, die die Ausgabe des ersten ausgeblendeten Layers darstellen, werden die Farben nicht mehr getrennt gehalten *. Tatsächlich ist jede Feature-Map ein "Kanal" in der nächsten Ebene, obwohl sie normalerweise separat visualisiert werden, wobei die Eingabe mit kombinierten Kanälen visualisiert wird. Eine andere Art, darüber nachzudenken, besteht darin, dass die separaten RGB-Kanäle im Originalbild 3 "Feature-Maps" in der Eingabe sind.
Es spielt keine Rolle, wie viele Kanäle oder Features sich in einer vorherigen Ebene befinden. Die Ausgabe für jede Feature-Map in der nächsten Ebene ist ein einzelner Wert in dieser Map. Ein Ausgabewert entspricht einem einzelnen virtuellen Neuron, das ein Vorspannungsgewicht benötigt.
In einem CNN werden, wie Sie in der Frage erläutern, an jedem Punkt in der Ausgabe-Feature-Map dieselben Gewichte (einschließlich des Bias-Gewichts) verwendet. Jede Feature-Map hat also sowohl ein eigenes Bias-Gewicht als auch ein eigenes previous_layer_num_features x kernel_width x kernel_height
Verbindungsgewicht.
Ja, Ihr Beispiel, das zu einer (3 x (5x5) + 1) x 32
Gesamtgewichtung für die erste Schicht führt, ist für eine CNN korrekt, bei der die erste verborgene Schicht RGB-Eingaben in 32 separate Feature-Maps verarbeitet.
* Sie werden möglicherweise verwirrt, wenn Sie die Visualisierung der CNN- Gewichte sehen, die in die Farbkanäle unterteilt werden können, auf denen sie arbeiten.