Die Ohren der Menschen können Geräusche hören, deren Frequenzen zwischen 20 Hz und 20 kHz liegen. Basierend auf dem Nyquist-Theorem sollte die Aufzeichnungsrate mindestens 40 kHz betragen. Ist es der Grund für die Wahl von 44,1 kHz?
Die Ohren der Menschen können Geräusche hören, deren Frequenzen zwischen 20 Hz und 20 kHz liegen. Basierend auf dem Nyquist-Theorem sollte die Aufzeichnungsrate mindestens 40 kHz betragen. Ist es der Grund für die Wahl von 44,1 kHz?
Antworten:
Es ist wahr, dass die Wahl von 44,1 kHz wie bei jeder Konvention ein historischer Unfall ist. Es gibt einige andere historische Gründe.
Natürlich muss die Abtastrate 40 kHz überschreiten, wenn Sie eine hohe Audioqualität mit einer Bandbreite von 20 kHz wünschen.
Es wurde diskutiert, 48,0 kHz zu erzeugen (es stimmte gut mit 24 Bildern / Sekunde und den angeblichen 30 Bildern / Sekunde im nordamerikanischen Fernsehen überein), aber angesichts der physischen Größe von 120 mm gab es eine Grenze für die Datenmenge Die CD kann gespeichert werden, und da ein Fehlererkennungs- und -korrekturschema erforderlich ist und eine gewisse Datenredundanz erforderlich ist , entspricht die Menge der auf der CD gespeicherten logischen Daten (etwa 700 MB) etwa der Hälfte der Menge der physischen Daten. Angesichts all dessen, mit einer Frequenz von 48 kHz, wurde uns mitgeteilt, dass es nicht alle 9 von Beethoven halten könne, sondern dass es die gesamte 9 mit einer etwas langsameren Geschwindigkeit auf einer Scheibe halten könne . Also 48 kHz ist raus.
Warum immer noch 44,1 und nicht 44,0 oder 45,0 kHz oder eine nette runde Zahl?
Damals gab es in den späten 1970er Jahren ein Produkt namens Sony F1 , mit dem digitales Audio auf ein sofort verfügbares Videoband (Betamax, nicht VHS) aufgezeichnet werden konnte. Das war bei 44,1 kHz (oder genauer 44,056 kHz). Auf diese Weise können Aufnahmen ohne Neuabtastung und Interpolation einfach von F1 auf CD oder in die andere Richtung übertragen werden.
Mein Verständnis, wie es dahin kommt, ist, dass die horizontale Abtastrate von NTSC-TV 15,750 kHz betrug und 44,1 kHz genau das 2,8-fache ist. Ich bin mir nicht ganz sicher, aber ich glaube, das bedeutet, dass Sie drei Stereo-Sample-Paare pro horizontaler Zeile haben können, und für jeweils fünf Zeilen, bei denen Sie normalerweise 15 Samples hätten, gibt es 14 Samples plus ein zusätzliches Sample für einige Paritätsprüfung oder Redundanz in der F1. 14 Abtastungen für 5 Zeilen entsprechen 2,8 Abtastungen pro horizontaler Zeile, und bei 15.750 Zeilen pro Sekunde ergeben sich 44.100 Abtastungen pro Sekunde.
Seit Einführung des Farbfernsehens musste die horizontale Zeilenrate leicht auf 15734 Zeilen pro Sekunde gesenkt werden. Diese Anpassung führt zu den 44.056 Abtastungen pro Sekunde in der Sony F1.
Schauen Sie sich zum Beispiel http://www1.cs.columbia.edu/~hgs/audio/44.1.html an. Sie sollten aufgrund von Anti-Aliasing-Filtern eine Abtastrate von mehr als 40 kHz verwenden. Sie sollten eine gewisse Frequenzreserve haben, um eine Signalverzerrung aufgrund der Ansprechflanke des Filters zu vermeiden. Der tatsächliche Wert von 44,1 kHz wurde von der Sony Corporation vorgeschlagen, als der Audioaufnahmestandard 1979 diskutiert wurde. Sie verwendeten diese Rate für diesen Moment weit verbreitet.
Es ist also im Allgemeinen ein historischer Grund.
Beim Übergang zu digitalen Formaten wurden Audiodaten in einer Pseudo-Video-Wellenform gespeichert, die entweder als schwarz oder weiß (als Darstellung des Binärformats) angesehen werden konnte.
Die vom Fernsehstandard verwendete Halbbildrate und -struktur ist für 60-Hz-Video wie folgt: 245 Zeilen pro Halbbild (ausgenommen die ersten 35 ausgeblendeten Zeilen). Mit drei Abtastwerten pro Zeile ergibt dies 60 x 245 x 3 = 44100 = 44,1 kHz.
Diese Konvention wurde später aus Gründen der Gerätekompatibilität für das CD-Format verwendet (das allererste Gerät, das zur Herstellung von CD-Mastern für die CD-Replikation verwendet wurde, war videobasiert).
Es scheint, dass die Hörgrenze für Menschen viel höher als 20 kHz sein könnte, wenn man sie aus der Perspektive der "dynamischen" Zeitauflösung betrachtet, anstatt der typischen statischen Sinuswellen. Interessante Kommentare zur Spanne zwischen 20 kHz und 22 kHz für die Rekonstruktionsfilterung. Tatsächlich gab es von Peter Craven eine interessante Arbeit zur zeitdomänenoptimierten Filterung, die für mindestens 96 kHz für die HiFi-Wiedergabe spricht.
Pawel
https://en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Das Nyquist-Shannon-Abtasttheorem besagt, dass die Abtastfrequenz größer sein muss als das Doppelte der maximalen Frequenz, die reproduziert werden soll. Da der menschliche Hörbereich etwa 20 Hz bis 20.000 Hz beträgt, musste die Abtastrate größer als 40 kHz sein.
Außerdem müssen die Signale vor dem Abtasten tiefpassgefiltert werden, um ein Aliasing zu vermeiden. Während ein ideales Tiefpassfilter Frequenzen unter 20 kHz perfekt durchlassen würde (ohne sie zu dämpfen) und Frequenzen über 20 kHz perfekt abschneiden würde, ist ein solches ideales Filter theoretisch unmöglich (es ist nicht kausal), so dass in der Praxis ein Übergangsband notwendig ist. wo Frequenzen teilweise gedämpft sind. Je breiter dieses Übergangsband ist, desto einfacher und wirtschaftlicher ist es, ein Anti-Aliasing-Filter zu erstellen. Die Abtastfrequenz von 44,1 kHz ermöglicht ein Übergangsband von 2,05 kHz.
Außerdem ist 44.100 das Produkt der Quadrate der ersten vier Primzahlen (2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2) und hat daher viele nützliche kleine Faktoren.
Eine Beschreibung finden Sie unter [ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone] . Ein Theorem, das Nyquist-Abtasttheorem genannt wird, besagt, dass Sie zum Abtasten eines Signals mit X Hz ohne signifikanten Qualitätsverlust die Frequenz mit 2X abtasten müssen. Die Grenze des menschlichen Gehörs liegt bei ungefähr 20 kHz, was eine Abtastrate von ungefähr 40 kHz erfordert. Aus diesem Grund werden CDs mit 44 kHz abgetastet. Das heißt, jede Sekunde der Aufnahme auf einer CD enthält 44.000 Messungen mit der höchstmöglichen Frequenz, die in der Aufnahme enthalten ist.