Ich verwende MySQL, um eine Basistabelle dieses Formats zu speichern:
id int(11) //Auto-Incrementing ID
data varchar(5120) //Random input data, compressed by a program, not mysql.
-----------------------
Row size ø 916 B
Das ist beunruhigend, denn im Moment habe ich jeden Monat ungefähr 5.000 Datensätze, und ich möchte das besser optimieren, als am Ende einen Durchschnitt von 1 MB / 1000 Datensätzen zu erreichen.
Ich habe es ursprünglich so eingerichtet, weil ich die größeren Sets erfassen wollte, aber sie sind sehr selten, wie Sie hier in dieser Grafik sehen können:
count n*128 bytes
+-------+----------
1 28
1 26
1 24
2 22
8 21
4 20
13 19
12 18
16 17
27 16
43 15
58 14
69 13
114 12
184 11
262 10
399 9
588 8
807 7
1224 6
1245 5
546 4
73 3
9 2
6 1
1 0
Mein Hauptanliegen hier ist, wie viel Platz ich verschwendet habe, um das hintere Ende dieses Diagramms unterzubringen, und was passiert, wenn ich am Ende noch größere Ausreißer habe? Ich muss meine Zeilengröße erneut erhöhen, wenn ungefähr 80% der Daten sehr gut in einen varchar 1024-Block passen, 1/5 der Größe dessen, was ich jetzt verwende.
Wie hätte ich dieses Ding überhaupt bauen sollen?