Als «parallel-computing» getaggte Fragen

Die Untersuchung der Lösung von Rechenproblemen durch gleichzeitige Nutzung mehrerer Prozessoren.

2
Auswahl des linearen Lösers für die GPGPU-Berechnung (OpenCL)
Ich habe bereits eine funktionierende Lösung der Finite-Elemente-Methode entwickelt, um Wärmeübertragungsprobleme mit GPU und OpenCL mithilfe der Conjugate Gradient-Methode zu lösen. Der Hauptnachteil dieses Verfahrens ist der hohe Speicherbedarf. Darüber hinaus ist bei Grafikkarten der Speicher oft sehr begrenzt. Ich sehe zwei Möglichkeiten: Erstellen Sie Subdomains und tauschen Sie Teile …

1
Wie kann ein Matrixsystem parallel aus Werten zusammengesetzt und gelöst werden, die in verschiedenen Prozessoren generiert wurden?
Ich löse ein Multiskalenproblem mit der Heterogenen Multiskalenmethode (HMM) . Im Wesentlichen verwendet mein spezielles Verfahren den folgenden iterativen Prozess: Lösen Sie viele lokale Matrixsysteme. Berechnen Sie einen interessierenden Wert aus den Lösungen der lokalen Systeme. Stellen Sie ein globales Matrixsystem aus den lokalen "interessierenden Werten" zusammen. Lösen Sie das …

3
Paralleler Mersenne Twister für Monte Carlo
Kürzlich stieß ich auf einen Kommentar, in dem behauptet wurde, dass fast alle Forscher, die Monte-Carlo-Methoden anwenden, es falsch machen. Es wurde weiter ausgeführt, dass die bloße Auswahl verschiedener Samen für verschiedene Instanzen eines PRNG wie des Mersenne Twister nicht ausreicht, um unvoreingenommene Ergebnisse zu gewährleisten, da schlimme Kollisionen auftreten …



2
Parallele Berechnung großer Kovarianzmatrizen
Wir müssen Kovarianzmatrizen mit Größen von bis 100000 × 100000 berechnen . Wir haben Zugriff auf GPUs und Cluster und fragen uns, was der beste parallele Ansatz ist, um diese Berechnungen zu beschleunigen.10000 × 1000010000×1000010000\times10000100000 × 100000100000×100000100000\times100000

4
Was ist ein robuster, iterativer Löser für große linear-elastische 3D-Probleme?
Ich tauche in die faszinierende Welt der Finite-Elemente-Analyse ein und möchte ein großes thermomechanisches Problem lösen (nur thermische Pfeilmechanik, kein Feedback).→→\rightarrow Für das mechanische Problem habe ich bereits aus Geoffs Antwort verstanden , dass ich aufgrund der Größe meines Netzes einen iterativen Löser verwenden muss. In Matts Antwort habe ich …

2
Intel Knights Landing arbeitet mit NVIDIA GeForce
Es werden viele Artikel darüber geschrieben, wie der neu eingeführte Intel Xeon Phi den Wettbewerbern den Marktanteil von HPC \ Super Computer stehlen wird. Intel Knights ist mit 72 Kernen und 4 Sockeln ausgestattet, was es zu einem 288-Kernsystem macht. Während ein einzelner Gtx980 2048 CUDA-Kerne hat. Wie können diese …

3
GPU-Bibliotheken für lineare Algebra-Operationen
Ich suche nach GPU-Bibliotheken, um meinen Code zu beschleunigen, dessen primäre "Hochleistungs" -Regionen Singularwertzerlegung, QR-Faktorisierung und Eigenwerte, Eigenvektorberechnung aufweisen. Ich habe die Website von Nvidia nach Tools wie CuBLAS, Magma usw. durchsucht, möchte den Code jedoch nicht in Cuda schreiben. Es wäre wunderbar, wenn es da draußen Bibliotheken gäbe, die …

1
MPI-Richtlinie für mehrere asynchrone Übertragungen
Was ist die Richtlinie für mehrere überlappende asynchrone Übertragungen in MPI? Ich habe ein Programm mit mehreren offenen asynchronen irecvOperationen. Ich finde, dass Übertragungen, die stattfinden könnten (der entsprechende isendwurde aufgerufen), auf andere Übertragungen warten, die noch nicht bereit sind (der entsprechende isendwurde noch nicht aufgerufen). Um klar zu sein, …

1
Lösen eines großen nicht-hermitischen verallgemeinerten Eigenwertproblems aus einer linearen Stabilitätsanalyse mit SLEPc
Ich habe ein verallgemeinertes Matrixproblem: aus einer Spektralmethode für ein Problem der linearen Stabilitätsanalyse. Meine Matrix B ist diagonal und positiv semidefinit. A ist nicht hermitisch und komplex.Ax=λBxAx=λBxA x = \lambda B x Mein Problem ist im Wesentlichen, dass bei Verwendung des verallgemeinerten SLEPc-Eigenwertlösers der Fehler "Null-Pivot bei der LU-Faktorisierung" …

1
Welchen Algorithmus für die parallele dichte Matrixinversion auf höchstens 8 Kernen verwenden?
Ich muss eine parallele dichte Matrixinversion für eine Sprache implementieren, die ich verwende und für die anscheinend keine Bibliothek vorhanden ist (insbesondere IDL mit IDL Bridge für die Nachrichtenübermittlung). Ich bin mit parallelen Programmiermethoden durch Erfahrung mit MPI in C ++ vertraut, allerdings hauptsächlich für parallele FFT- und N-Body-Methoden. Ich …



4
Wie kann ich einen parallelen linearen kongruenten Pseudozufallszahlengenerator für die maximale Periode setzen?
Normalerweise verwende ich den Aufruf, wenn ich einen sequentiellen Zufallszahlengenerator in C setze srand(time(NULL)) dann benutze rand() mod N um eine zufällige ganze Zahl zwischen 0 und N-1 zu erhalten. Wenn ich dies jedoch parallel mache, sind die Aufrufe zur Zeit (NULL) so nahe beieinander, dass sie genau dieselbe Nummer …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.