Es wird oft erwähnt, dass gleichgerichtete Lineareinheiten (ReLU) Softplus-Einheiten abgelöst haben, weil sie linear sind und schneller berechnet werden können.
Hat softplus it noch den Vorteil der Sparity-Induktion oder ist das auf die ReLU beschränkt?
Der Grund, den ich frage, ist, dass ich mich über die negativen Konsequenzen der Null-Steigung der ReLU wundere. Fängt diese Eigenschaft nicht Einheiten bei Null ein, wo es vorteilhaft sein könnte, ihnen die Möglichkeit der Reaktivierung zu geben?