Ich benutze HDF5 seit Jahren, aber mit zunehmender Größe des Datensatzes treten die gleichen Probleme auf, die hier aufgeführt sind
http://cyrille.rossant.net/moving-away-hdf5/
Können Sie mich auf ein Format wie HDF5 verweisen mit - Gute Unterstützung für paralleles Schreiben - Unterstützung für den Chunked-Zugriff auf große Matrizen
Mein typischer Anwendungsfall ist eine 100k x 100k Integer-Matrix. Ich möchte es aus logischer Sicht als ganze Datei haben, aber ich muss es Stück für Stück mit parallelen Arbeitern schreiben.