Unsere Plasmadynamiksimulationen liefern oft zu viele Informationen. Während der Simulationen zeichnen wir verschiedene physikalische Eigenschaften auf einem Gitter (x, y, z, t) mit einer Größe von (8192 x 1024 x 1024 x 1500) für mindestens 10 Eigenschaften auf. Diese Informationen werden nach Abschluss der Simulation verarbeitet. Damit wir
- Filme von Immobilien machen,
- eine Fourier-Analyse durchführen,
- Durchschnittswerte berechnen.
Dieses einfache Speichern so vieler Informationen wie möglich funktionierte einwandfrei, als wir kleinere Systeme untersuchten. Dies gab uns die Flexibilität, mit den Ergebnissen zu interagieren und später zu entscheiden, was wir damit machen wollten. Außerdem konnten wir unsere Rechenressourcen (CPU-Zeit) für die einfache Ausführung der Simulationen verwenden.
Wir haben damit begonnen, die Fourier-Analyse im laufenden Betrieb durchzuführen und nur nach einem ausgewählten Bereich von Längenskalen zu filtern. Aus numerischen Gründen müssen wir manchmal Längenskalen auflösen, die kleiner sind, als wir tatsächlich interessiert sind. In diesen Fällen hilft dieser Filter sehr. Wir untersuchen auch verschiedene parallele E / A- Bibliotheken, z. B. parallele E / A-Optionen, insbesondere paralleles HDF5 .
Welche Strategien stehen zur Verfügung, um die Effizienz der Datenverarbeitung zu maximieren?
Hat es einen Vorteil, alle Analysen (ohne Nachbearbeitung, z. B. Filme und Plots) im laufenden Betrieb durchzuführen?
Ich kann mir vorstellen, dass dieses Problem in anderen Bereichen der Forschung auftaucht. Zum Beispiel könnten Sie eine Molekulardynamiksimulation haben, die sich für eine lange Zeit entwickeln muss, aber Sie interessieren sich für den kurzen Moment, in dem etwas Interessantes passiert. Bei CFD ist die frühe Zeitentwicklung möglicherweise langsam, aber sobald Turbulenzen auftreten, ist möglicherweise eine höhere Zeitauflösung erforderlich, um die Dynamik zu überwachen.
Gibt es frei verfügbare Beispiele für eine ausgefeilte Ergebniserfassung aus Simulationen?