Als «performance» getaggte Fragen

Fragen zur Ausführungsgeschwindigkeit und Speichernutzung von Algorithmen, Datenstrukturen, Sprachen und Bibliotheken.

4
Wie gehe ich mit zu vielen Daten um?
Unsere Plasmadynamiksimulationen liefern oft zu viele Informationen. Während der Simulationen zeichnen wir verschiedene physikalische Eigenschaften auf einem Gitter (x, y, z, t) mit einer Größe von (8192 x 1024 x 1024 x 1500) für mindestens 10 Eigenschaften auf. Diese Informationen werden nach Abschluss der Simulation verarbeitet. Damit wir Filme von …


5
Berechnung der Sparsity-Struktur für Finite-Elemente-Matrizen
Frage: Mit welchen Methoden kann die Sparsity-Struktur einer Finite-Elemente-Matrix genau und effizient berechnet werden? Info: Ich arbeite an einem Poisson-Druckgleichungslöser nach der Methode von Galerkin auf quadratischer Lagrange-Basis, geschrieben in C, und verwende PETSc für die Speicherung von spärlicher Matrix und KSP-Routinen. Um PETSc effizient zu nutzen, muss der globalen …


4
FLOP-Zählung für Bibliotheksfunktionen
Wenn man die Anzahl der FLOPs in einer einfachen Funktion auswertet, kann man oft einfach den Ausdruck mit den Grundrechenarten durchgehen. Bei mathematischen Aussagen mit gerader Division kann man dies jedoch nicht tun und erwartet, mit FLOP-Zählungen von Funktionen, die nur Additionen und Multiplikationen enthalten, vergleichen zu können. Die Situation …

2
Was ist der schnellste Weg, um alle Eigenwerte einer sehr großen und spärlichen Adjazenzmatrix in Python zu berechnen?
Ich versuche herauszufinden, ob es einen schnelleren Weg gibt, alle Eigenwerte und Eigenvektoren einer sehr großen und spärlichen Adjazenzmatrix zu berechnen, als mit scipy.sparse.linalg.eigsh Soweit ich weiß, verwendet diese Methode nur die Spärlichkeit und Symmetrieattribute der Matrix. Eine Adjazenzmatrix ist auch binär, was mich glauben lässt, dass es einen schnelleren …


3
In welchen Anwendungsfällen sind additive Vorkonditionierungsschemata multiplikativen überlegen?
Sowohl bei der Domänenzerlegung (DD) als auch bei der Multigrid-Methode (MG) kann man die Anwendung der Blockaktualisierungen oder der Grobkorrekturen entweder additiv oder multiplikativ zusammenstellen . Für Punktlöser ist dies der Unterschied zwischen der Jacobi- und der Gauß-Seidel-Iteration. Die multiplikative glattere für , die als S ( x o l …

2
Was ist die zugrunde liegende Struktur der Leistung von wissenschaftlichem Code?
Betrachten Sie zwei Computer mit unterschiedlichen Hardware- und Softwarekonfigurationen. Wenn auf jeder Plattform genau derselbe serielle Navier-Stokes-Code ausgeführt wird, dauert es x- und y-Zeit, um eine Iteration für Computer 1 bzw. 2 auszuführen. In diesem Fall ist die Iterationszeitdifferenz zwischen Computer 1 und Computer 2.Δ = x - yΔ=x−y\Delta = …

1
Statistische Modelle für lokalen Speicher / Computer, Netzwerklatenz und Bandbreitenjitter in HPC
Parallele Berechnungen werden häufig unter Verwendung einer deterministischen lokalen Berechnungsrate, des Latenzaufwands und der Netzwerkbandbreite modelliert. In Wirklichkeit sind diese räumlich variabel und nicht deterministisch. Studien wie Skinner und Kramer (2005) beobachten multimodale Verteilungen, aber die Leistungsanalyse scheint immer entweder deterministische oder Gaußsche Verteilungen zu verwenden (nicht nur ungenau, sondern …


3
Nvidia K20X gegen GeForce Titan für GPGPU-Beschleunigung
Ich versuche den Unterschied zwischen diesen beiden Grafikkarten für das akademische Rechnen zu verstehen, speziell für die DGEMM-Komponente. Wenn wir uns die Rohstatistik ansehen, haben beide den gleichen GK110-Chip, vergleichbare Statistiken in praktisch jeder Kategorie und, glaube ich, die gleiche Kernarchitektur. Vor jeglichen Rabatten ist der K20X ungefähr viermal so …

1
Welche Auswirkungen hat die C ++ 11-Bewegungssemantik im Kontext des wissenschaftlichen Rechnens?
C ++ 11 führt eine Verschiebungssemantik ein, die beispielsweise die Codeleistung in Situationen verbessern kann, in denen C ++ 03 eine Kopierkonstruktion oder eine Kopierzuweisung durchführen müsste. Dieser Artikel berichtet, dass der folgende Code beim Kompilieren mit C + 11 eine 5-fache Geschwindigkeit erfährt: vector<vector<int> > V; for(int k = …

3
Literaturhinweise zur Modellierung aktueller und zukünftiger Energiekosten von Gleitkommaoperationen und Datenübertragungen
Ich suche nach der wichtigsten Literatur und Folienreferenzen zur Modellierung der aktuellen und zukünftigen Energiekosten von Gleitkommaoperationen und Datenübertragungen über CPU, Speicher, Netzwerk und Speicher. Ich habe diese Frage als Community-Wiki markiert und möchte, dass Sie jede Antwort auf das folgende Format beschränken: Titel, Autoren, Ort / Konferenz / Zeitschrift, …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.