Welche nützlichen Algorithmen gibt es, die mit großen Datenströmen arbeiten und deren Ergebnisse relativ klein sind, und man kann das Ergebnis für eine Mischung aus zwei Datenströmen berechnen, indem man deren Ergebnisse irgendwie zusammenführt?
Ich kann einige nennen:
- Die offensichtlichen Dinge wie Summe, Min, Max, Zählung, Top-K usw.
- Ungefähre sogenannte "skizzenbasierte" Stream-Algorithmen für Histogramme, die unterschiedliche Elemente zählen oder Quantile berechnen
Welche anderen gibt es?
(Ich bin interessiert, weil ich ein Hobbyprojekt zur Überwachung verteilter Systeme schreibe, dessen Nützlichkeit direkt durch die Nützlichkeit solcher Algorithmen bestimmt wird.)