Ich arbeite am Seq2Seq-Modell mit LSTM von Keras (mit Theano-Hintergrund) und möchte die Prozesse parallelisieren, da selbst wenige MB Daten mehrere Stunden für das Training benötigen.
Es ist klar, dass GPUs bei der Parallelisierung weitaus besser sind als CPUs. Im Moment habe ich nur CPUs, mit denen ich arbeiten kann. Ich konnte auf 16 CPUs zugreifen (2 Threads pro Kern x 4 Kerne pro Sockel x 2 Sockel)
Aus dem Dokument der Multi-Core- Unterstützung in Theano konnte ich alle vier Kerne eines einzelnen Sockets verwenden. Grundsätzlich ist die CPU zu 400% ausgelastet, wobei 4 CPUs verwendet werden, und die verbleibenden 12 CPUs bleiben ungenutzt. Wie nutze ich sie auch? Tensorflow kann auch anstelle des Theano-Hintergrunds verwendet werden, wenn dies funktioniert.