Ich lese über Lambda-Architektur.
Es ergibt Sinn. Wir haben warteschlangenbasierte Datenaufnahme. Wir haben einen In-Memory-Speicher für Daten, der sehr neu ist, und wir haben HDFS für alte Daten.
Wir haben also unseren gesamten Datensatz. in unserem System. sehr gut.
Das Architekturdiagramm zeigt jedoch, dass die Zusammenführungsschicht sowohl die Batch-Schicht als auch die Geschwindigkeitsschicht auf einmal abfragen kann.
Wie geht das?
Ihr Batch-Layer ist wahrscheinlich ein Job zur Kartenreduzierung oder eine HIVE-Abfrage. Die Geschwindigkeitsschichtabfrage ist wahrscheinlich ein Scala-Programm, das auf dem Funken ausgeführt wird.
Wie werden Sie diese nun zusammenführen?
Gibt es eine Anleitung?