Ich muss sofort klarstellen, dass ich ein praktizierender Softwareentwickler bin, kein Statistiker, und dass meine College-Statistik-Klasse schon sehr lange her ist…
Allerdings würde ich gerne wissen, ob es eine Methode zum Sammeln einer Reihe von beschreibenden Statistiken gibt, mit der dann ein Boxplot erstellt werden kann, bei dem keine einzelnen Stichproben gespeichert werden müssen.
Ich versuche, eine grafische Zusammenfassung der Warteschlangendienstzeiten in einem komplexen Prozess mit mehreren Warteschlangen zu erstellen. Ich habe in der Vergangenheit ein Paket namens tnftools verwendet, mit dem große Samples akkumuliert und dann zu einem schönen Diagramm mit Antwortzeiten und Ausreißern nachbearbeitet werden konnten. Aber tnftools sind für meine aktuelle Plattform nicht verfügbar.
Im Idealfall möchte ich in der Lage sein, eine Reihe von beschreibenden Statistiken "on the fly" zu sammeln, während der Prozess abläuft, und dann die Daten zur Analyse nach Bedarf zu extrahieren. Der Prozess kann jedoch nicht einfach Samples akkumulieren, da der damit verbundene Speicher / E / A-Aufwand die Leistung des Systems inakzeptabel beeinträchtigen würde.