Wir haben eine regelmäßige Aufgabe, die du
Zusammenfassungen einer Reihe von Unterverzeichnissen durchführt, die schlimmsten Straftäter heraussucht und anhand der Ergebnisse ermittelt, ob es Dinge gibt, die schnell zunehmen, um potenzielle Probleme zu erkennen. Wir verwenden diff
Schnappschüsse, um sie zu vergleichen.
Es gibt ein Verzeichnis der obersten Ebene mit einigen hundert Unterverzeichnissen, von denen jedes Zehntausende von Dateien (oder mehr) enthalten kann.
Ein " du -s
" in diesem Zusammenhang kann sehr IO-aggressiv sein und dazu führen, dass unser Server seinen Cache nicht mehr unterstützt und dann massive IO-Spikes auftreten, die eine sehr unerwünschte Nebenwirkung sind.
Welche Strategie kann verwendet werden, um dieselben Daten ohne die unerwünschten Nebenwirkungen zu erhalten?