Ich muss Binärdatendateien in einer PostgreSQL-Datenbank speichern, die auf einem Ubuntu-Server ausgeführt wird. Zunächst werden einige Dutzend Dateien mit einer Größe von jeweils ca. 250 KB vorhanden sein. Die Anzahl der Dateien nimmt jedoch mit der Zeit zu. Manchmal muss ich möglicherweise Daten aus den Dateien für andere nachgelagerte Analysen extrahieren.
Ich habe einige Nachforschungen über die uralte Frage der Speicherung von Binärdaten als BLOBs oder Referenzen angestellt. Beide haben offensichtlich ihre Vor- und Nachteile. Gibt es spezielle Probleme im Zusammenhang mit PostgreSQL, die ich beachten sollte? Ist die eine oder andere Methode vorzuziehen, wenn ich Daten aus den Dateien extrahieren möchte, entweder über eine PostgreSQL-Funktion oder über ein externes Python-Programm?
Wenn ich die Datendateien direkt in der Datenbank speichern würde, wäre es besser, sie in einer separaten Tabelle mit einem Fremdschlüssel zu speichern, der auf die "Haupt" -Tabelle verweist, als in der Tabelle, die alle anderen Felder enthält?
Ich habe die Frage und die Antworten hier gelesen . Ein Kommentar dort deutet darauf hin, dass das Speichern von Binärdateien als Referenz (im Dateisystem) unter Linux besser ist. Meine Fragen hier beziehen sich speziell auf PostgreSQL und auf das Extrahieren von Daten aus den Dateien für verschiedene Analysen.
Update: Ähnliche Frage .