Unsere Plasmadynamiksimulationen liefern oft zu viele Informationen. Während der Simulationen zeichnen wir verschiedene physikalische Eigenschaften auf einem Gitter (x, y, z, t) mit einer Größe von (8192 x 1024 x 1024 x 1500) für mindestens 10 Eigenschaften auf. Diese Informationen werden nach Abschluss der Simulation verarbeitet. Damit wir Filme von …
Ich weiß, dass ATLAS in der Lage ist, sich für die Maschine zu optimieren, auf der es kompiliert wird, und somit maximale Vorteile durch das Kompilieren aus dem Quellcode erzielt. Hat das Kompilieren von LAPACK aus dem Quellcode einen Vorteil? Es wäre viel einfacher, nur das vorgefertigte Paket zu installieren.
Frage: Mit welchen Methoden kann die Sparsity-Struktur einer Finite-Elemente-Matrix genau und effizient berechnet werden? Info: Ich arbeite an einem Poisson-Druckgleichungslöser nach der Methode von Galerkin auf quadratischer Lagrange-Basis, geschrieben in C, und verwende PETSc für die Speicherung von spärlicher Matrix und KSP-Routinen. Um PETSc effizient zu nutzen, muss der globalen …
In diesem Beispielprogramm mache ich dasselbe (zumindest denke ich das) auf zwei verschiedene Arten. Ich führe dies auf meinem Linux-PC aus und überwache die Speichernutzung mit top. Bei der Verwendung von gfortran stelle ich fest, dass auf die erste Weise (zwischen "1" und "2") der verwendete Speicher 8,2 GB beträgt, …
Wenn man die Anzahl der FLOPs in einer einfachen Funktion auswertet, kann man oft einfach den Ausdruck mit den Grundrechenarten durchgehen. Bei mathematischen Aussagen mit gerader Division kann man dies jedoch nicht tun und erwartet, mit FLOP-Zählungen von Funktionen, die nur Additionen und Multiplikationen enthalten, vergleichen zu können. Die Situation …
Ich versuche herauszufinden, ob es einen schnelleren Weg gibt, alle Eigenwerte und Eigenvektoren einer sehr großen und spärlichen Adjazenzmatrix zu berechnen, als mit scipy.sparse.linalg.eigsh Soweit ich weiß, verwendet diese Methode nur die Spärlichkeit und Symmetrieattribute der Matrix. Eine Adjazenzmatrix ist auch binär, was mich glauben lässt, dass es einen schnelleren …
Angenommen, ich habe zwei Matrizen Nx2, Mx2, die jeweils N, M 2d Vektoren darstellen. Gibt es eine einfache und gute Möglichkeit, die Abstände zwischen den einzelnen Vektorpaaren (n, m) zu berechnen? Der einfache, aber ineffiziente Weg ist natürlich: d = zeros(N, M); for i = 1:N, for j = 1:M, …
Sowohl bei der Domänenzerlegung (DD) als auch bei der Multigrid-Methode (MG) kann man die Anwendung der Blockaktualisierungen oder der Grobkorrekturen entweder additiv oder multiplikativ zusammenstellen . Für Punktlöser ist dies der Unterschied zwischen der Jacobi- und der Gauß-Seidel-Iteration. Die multiplikative glattere für , die als S ( x o l …
Betrachten Sie zwei Computer mit unterschiedlichen Hardware- und Softwarekonfigurationen. Wenn auf jeder Plattform genau derselbe serielle Navier-Stokes-Code ausgeführt wird, dauert es x- und y-Zeit, um eine Iteration für Computer 1 bzw. 2 auszuführen. In diesem Fall ist die Iterationszeitdifferenz zwischen Computer 1 und Computer 2.Δ = x - yΔ=x−y\Delta = …
Parallele Berechnungen werden häufig unter Verwendung einer deterministischen lokalen Berechnungsrate, des Latenzaufwands und der Netzwerkbandbreite modelliert. In Wirklichkeit sind diese räumlich variabel und nicht deterministisch. Studien wie Skinner und Kramer (2005) beobachten multimodale Verteilungen, aber die Leistungsanalyse scheint immer entweder deterministische oder Gaußsche Verteilungen zu verwenden (nicht nur ungenau, sondern …
Dies ist ein einfaches Problem der Symmetrieaufzählung. Ich gebe hier den vollständigen Hintergrund an, aber es sind keine Kenntnisse der Quantenchemie erforderlich. Die beiden Teilchen integral ist: ⟨ i j | k l ⟩ = ∫ ψ * i ( x ) ψ * j ( x ' ) ψ …
Ich versuche den Unterschied zwischen diesen beiden Grafikkarten für das akademische Rechnen zu verstehen, speziell für die DGEMM-Komponente. Wenn wir uns die Rohstatistik ansehen, haben beide den gleichen GK110-Chip, vergleichbare Statistiken in praktisch jeder Kategorie und, glaube ich, die gleiche Kernarchitektur. Vor jeglichen Rabatten ist der K20X ungefähr viermal so …
C ++ 11 führt eine Verschiebungssemantik ein, die beispielsweise die Codeleistung in Situationen verbessern kann, in denen C ++ 03 eine Kopierkonstruktion oder eine Kopierzuweisung durchführen müsste. Dieser Artikel berichtet, dass der folgende Code beim Kompilieren mit C + 11 eine 5-fache Geschwindigkeit erfährt: vector<vector<int> > V; for(int k = …
Ich suche nach der wichtigsten Literatur und Folienreferenzen zur Modellierung der aktuellen und zukünftigen Energiekosten von Gleitkommaoperationen und Datenübertragungen über CPU, Speicher, Netzwerk und Speicher. Ich habe diese Frage als Community-Wiki markiert und möchte, dass Sie jede Antwort auf das folgende Format beschränken: Titel, Autoren, Ort / Konferenz / Zeitschrift, …
Skaliert die Matrixmultiplikation (sowohl Mat * Mat als auch Mat * Vec) mit der Anzahl der Nicht-Nullen oder mit der Größe der Matrix? Oder eine Kombination aus beiden. Was ist mit der Form? Zum Beispiel habe ich eine 100 x 100-Matrix mit 100 Werten oder eine 1000 x 1000-Matrix mit …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.