Ist es bei der Implementierung eines Mini-Batch-Gradientenabfalls für neuronale Netze wichtig, zufällige Elemente in jedem Mini-Batch zu verwenden? Oder reicht es aus, die Elemente zu Beginn des Trainings einmal zu mischen?
(Ich interessiere mich auch für Quellen, die definitiv sagen, was sie tun.)