Welches theoretische Parallelmodell kommt dem CUDA / OpenCL-Programmiermodell am nächsten?
Zum Beispiel passt es zu einem gewissen Grad zum generischen PRAM-Modell (Parallel Random Access Machine). Dies ist jedoch zu allgemein, da dadurch verschiedene Speicherzugriffslatenzen und Synchronisationsprobleme abstrahiert werden.
Meine Frage ist, welches theoretische Modell der CUDA-Architektur am besten entspricht (unter Berücksichtigung der hierarchischen Parallelität von Threads und Blöcken von Threads, die zusammenarbeiten).