Ich bin mir nicht sicher, ob jemand erklärt hat, warum die magische Zahl genau 1: 2 zu sein scheint und nicht zum Beispiel 1: 1,1 oder 1:20.
Ein Grund ist, dass in vielen typischen Fällen fast die Hälfte der digitalisierten Daten Rauschen ist und Rauschen (per Definition) nicht komprimiert werden kann.
Ich habe ein sehr einfaches Experiment gemacht:
Ich habe eine graue Karte genommen . Für ein menschliches Auge sieht es aus wie ein einfaches, neutrales Stück grauer Pappe. Insbesondere liegen keine Informationen vor .
Und dann habe ich einen normalen Scanner genommen - genau die Art von Gerät, mit der die Leute ihre Fotos digitalisieren könnten.
Ich habe die graue Karte gescannt. (Eigentlich habe ich die graue Karte zusammen mit einer Postkarte gescannt. Die Postkarte diente der Überprüfung der Gesundheit, um sicherzustellen, dass die Scannersoftware nichts Ungewöhnliches tut, z. B. automatisch Kontrast hinzufügen, wenn sie die nichtssagende graue Karte sieht.)
Ich habe einen 1000x1000 Pixel großen Teil der Graukarte zugeschnitten und in Graustufen umgewandelt (8 Bit pro Pixel).
Was wir jetzt haben, sollte ein ziemlich gutes Beispiel dafür sein, was passiert, wenn Sie einen nichtssagenden Teil eines gescannten Schwarzweiß-Fotos untersuchen , zum Beispiel klaren Himmel. Grundsätzlich sollte es genau nichts zu sehen geben.
Bei einer größeren Vergrößerung sieht es jedoch tatsächlich so aus:
Es gibt kein deutlich sichtbares Muster, aber es hat keine einheitliche graue Farbe. Ein Teil davon wird höchstwahrscheinlich durch die Unvollkommenheiten der Graukarte verursacht, aber ich würde annehmen, dass das meiste davon einfach vom Scanner erzeugtes Rauschen ist (thermisches Rauschen in der Sensorzelle, dem Verstärker, dem A / D-Wandler usw.). Sieht ziemlich nach Gaußschem Rauschen aus. Hier ist das Histogramm (in logarithmischer Skala):
Wenn wir nun annehmen, dass jeder Pixel seinen Schatten aus dieser Verteilung ausgewählt hat, wie viel Entropie haben wir dann? Mein Python-Skript hat mir gesagt, dass wir bis zu 3,3 Bit Entropie pro Pixel haben . Und das ist viel Lärm.
Wenn dies wirklich der Fall wäre, würde dies bedeuten, dass die 1000 × 1000-Pixel-Bitmap, egal welchen Komprimierungsalgorithmus wir verwenden, im besten Fall in eine 412500-Byte-Datei komprimiert wird. Und was passiert in der Praxis: Ich habe eine 432018-Byte-PNG-Datei, ziemlich nah.
Wenn wir ein wenig über generalisieren, scheint es, dass ich unabhängig davon, welche Schwarzweißfotos ich mit diesem Scanner scanne, die Summe der folgenden Werte erhalte:
- "nützliche" Informationen (falls vorhanden),
- Lärm, ca. 3 Bits pro Pixel.
Selbst wenn Ihr Komprimierungsalgorithmus die nützlichen Informationen in << 1 Bit pro Pixel komprimiert, haben Sie immer noch bis zu 3 Bit pro Pixel inkomprimierbares Rauschen. Und die unkomprimierte Version ist 8 Bit pro Pixel. Das Kompressionsverhältnis liegt also im Bereich von 1: 2, egal was Sie tun.
Ein weiteres Beispiel mit dem Versuch, überidealisierte Bedingungen zu finden:
- Eine moderne DSLR-Kamera mit der niedrigsten Empfindlichkeitseinstellung (geringstes Rauschen).
- Eine unscharfe Aufnahme einer Graukarte (selbst wenn die Graukarte sichtbare Informationen enthält, werden diese verwischt).
- Konvertierung der RAW-Datei in ein 8-Bit-Graustufenbild ohne Kontrast. Ich habe typische Einstellungen in einem kommerziellen RAW-Konverter verwendet. Der Konverter versucht standardmäßig, das Rauschen zu reduzieren. Außerdem speichern wir das Endergebnis als 8-Bit-Datei - wir werfen im Wesentlichen die niedrigstwertigen Bits der rohen Sensorwerte weg !
Und was war das Endergebnis? Es sieht viel besser aus als das, was ich vom Scanner bekommen habe. Das Geräusch ist weniger ausgeprägt und es ist genau nichts zu sehen. Trotzdem ist das Gaußsche Rauschen da:
Und die Entropie? 2,7 Bit pro Pixel . Dateigröße in der Praxis? 344923 Bytes für 1M Pixel. Im besten Fall haben wir die Komprimierungsrate mit einigem Betrug auf 1: 3 erhöht.
Natürlich hat all dies nichts mit TCS-Forschung zu tun, aber ich denke, es ist gut zu bedenken, was die Komprimierung von digitalisierten Daten in der realen Welt wirklich einschränkt. Fortschritte bei der Entwicklung ausgefeilterer Komprimierungsalgorithmen und der CPU-Rohleistung werden nicht helfen. Wenn Sie das Rauschen verlustfrei speichern möchten, können Sie nicht viel besser als 1: 2.