Ich habe bereits eine funktionierende Lösung der Finite-Elemente-Methode entwickelt, um Wärmeübertragungsprobleme mit GPU und OpenCL mithilfe der Conjugate Gradient-Methode zu lösen. Der Hauptnachteil dieses Verfahrens ist der hohe Speicherbedarf. Darüber hinaus ist bei Grafikkarten der Speicher oft sehr begrenzt. Ich sehe zwei Möglichkeiten: Erstellen Sie Subdomains und tauschen Sie Teile …
Ich löse ein Multiskalenproblem mit der Heterogenen Multiskalenmethode (HMM) . Im Wesentlichen verwendet mein spezielles Verfahren den folgenden iterativen Prozess: Lösen Sie viele lokale Matrixsysteme. Berechnen Sie einen interessierenden Wert aus den Lösungen der lokalen Systeme. Stellen Sie ein globales Matrixsystem aus den lokalen "interessierenden Werten" zusammen. Lösen Sie das …
Kürzlich stieß ich auf einen Kommentar, in dem behauptet wurde, dass fast alle Forscher, die Monte-Carlo-Methoden anwenden, es falsch machen. Es wurde weiter ausgeführt, dass die bloße Auswahl verschiedener Samen für verschiedene Instanzen eines PRNG wie des Mersenne Twister nicht ausreicht, um unvoreingenommene Ergebnisse zu gewährleisten, da schlimme Kollisionen auftreten …
Ich habe immer gehört, dass eine einfache Parallelisierung einer der Vorteile von DG-Methoden war, aber ich verstehe nicht wirklich, warum einer dieser Gründe nicht auch für kontinuierliches Galerkin gilt.
Ich frage mich, ob es eine sehr gute Mailingliste oder Google-Gruppen für Computational Science gibt, in denen wir Fragen diskutieren können, anstatt nur Fragen zu stellen und zu beantworten. Tatsächlich interessiere ich mich mehr für paralleles Rechnen und numerische Lösungen von PDEs. Aber ich weiß nicht, was und wie es …
Wir müssen Kovarianzmatrizen mit Größen von bis 100000 × 100000 berechnen . Wir haben Zugriff auf GPUs und Cluster und fragen uns, was der beste parallele Ansatz ist, um diese Berechnungen zu beschleunigen.10000 × 1000010000×1000010000\times10000100000 × 100000100000×100000100000\times100000
Ich tauche in die faszinierende Welt der Finite-Elemente-Analyse ein und möchte ein großes thermomechanisches Problem lösen (nur thermische Pfeilmechanik, kein Feedback).→→\rightarrow Für das mechanische Problem habe ich bereits aus Geoffs Antwort verstanden , dass ich aufgrund der Größe meines Netzes einen iterativen Löser verwenden muss. In Matts Antwort habe ich …
Es werden viele Artikel darüber geschrieben, wie der neu eingeführte Intel Xeon Phi den Wettbewerbern den Marktanteil von HPC \ Super Computer stehlen wird. Intel Knights ist mit 72 Kernen und 4 Sockeln ausgestattet, was es zu einem 288-Kernsystem macht. Während ein einzelner Gtx980 2048 CUDA-Kerne hat. Wie können diese …
Ich suche nach GPU-Bibliotheken, um meinen Code zu beschleunigen, dessen primäre "Hochleistungs" -Regionen Singularwertzerlegung, QR-Faktorisierung und Eigenwerte, Eigenvektorberechnung aufweisen. Ich habe die Website von Nvidia nach Tools wie CuBLAS, Magma usw. durchsucht, möchte den Code jedoch nicht in Cuda schreiben. Es wäre wunderbar, wenn es da draußen Bibliotheken gäbe, die …
Was ist die Richtlinie für mehrere überlappende asynchrone Übertragungen in MPI? Ich habe ein Programm mit mehreren offenen asynchronen irecvOperationen. Ich finde, dass Übertragungen, die stattfinden könnten (der entsprechende isendwurde aufgerufen), auf andere Übertragungen warten, die noch nicht bereit sind (der entsprechende isendwurde noch nicht aufgerufen). Um klar zu sein, …
Ich habe ein verallgemeinertes Matrixproblem: aus einer Spektralmethode für ein Problem der linearen Stabilitätsanalyse. Meine Matrix B ist diagonal und positiv semidefinit. A ist nicht hermitisch und komplex.Ax=λBxAx=λBxA x = \lambda B x Mein Problem ist im Wesentlichen, dass bei Verwendung des verallgemeinerten SLEPc-Eigenwertlösers der Fehler "Null-Pivot bei der LU-Faktorisierung" …
Ich muss eine parallele dichte Matrixinversion für eine Sprache implementieren, die ich verwende und für die anscheinend keine Bibliothek vorhanden ist (insbesondere IDL mit IDL Bridge für die Nachrichtenübermittlung). Ich bin mit parallelen Programmiermethoden durch Erfahrung mit MPI in C ++ vertraut, allerdings hauptsächlich für parallele FFT- und N-Body-Methoden. Ich …
Jeder kennt Referenzen, die die Geschichte und die Ideen hinter Supercomputing zusammenfassen, einschließlich der Erwähnung von Entwicklungen in parallelen Programmiersprachen, Anwendungen, Startup-Unternehmen (einige wurden gegründet, aber nicht überlebt), Anforderungen der Industrie usw.
Ich schreibe Codes in Fortran und C für verschiedene Matrixalgorithmen. Wenn ich meine Codes jedoch mit VTune profiliere, stoße ich normalerweise auf eine Terminologie, die ich nicht vollständig einschätzen kann. Gibt es eine gute Ressource, um das Profiling von Grund auf bis zu einem ziemlich fortgeschrittenen Niveau zu lernen? Obwohl …
Normalerweise verwende ich den Aufruf, wenn ich einen sequentiellen Zufallszahlengenerator in C setze srand(time(NULL)) dann benutze rand() mod N um eine zufällige ganze Zahl zwischen 0 und N-1 zu erhalten. Wenn ich dies jedoch parallel mache, sind die Aufrufe zur Zeit (NULL) so nahe beieinander, dass sie genau dieselbe Nummer …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.