Ich las die Arbeit Deep Residual Learning for Image Recognition und hatte Schwierigkeiten, mit 100% iger Sicherheit zu verstehen, was ein Restblock rechnerisch bedeutet. Beim Lesen ihrer Zeitung haben sie Abbildung 2:
Dies zeigt, was ein Restblock sein soll. Ist die Berechnung eines Restblocks einfach dieselbe wie:
Oder ist es etwas anderes?
Mit anderen Worten, um zu versuchen, mit der Notation des Papiers übereinzustimmen, ist:
ist das wahr?
Beachten Sie, dass nach der Kreissummierung das Wort ReLU auf dem Papier erscheint, daher sollte die Ausgabe eines Restblocks (den ich mit ) sein:
mit einem zusätzlichen ReLU-Nichtlinearitäts- .