Vielleicht eine dumme Frage, aber wenn es eine Zeitbereichsdarstellung des Audiosignals und auch des Frequenzbereichs gibt, gibt es dann einen anderen Bereich, in dem das Signal dargestellt werden kann?
Vielleicht eine dumme Frage, aber wenn es eine Zeitbereichsdarstellung des Audiosignals und auch des Frequenzbereichs gibt, gibt es dann einen anderen Bereich, in dem das Signal dargestellt werden kann?
Antworten:
Audio existiert wirklich nur im Zeitbereich, in Audio übersetzen wir es in die Summe der Sinuswellen, weil dies damit zusammenhängt, wie wir Geräusche hören. Es gibt andere Möglichkeiten, wie Sounds interpretiert werden können. Alles hängt davon ab, ob diese Darstellung für Sie nützlich ist. Dinge, die Sie interessieren könnten, sind Wavelets, Granulatsynthesen, Formantensynthesen. Ich erinnere mich, dass ich über etwas gelesen habe, das funktioniert, indem es Klang als eine Art Granulatsynthese darstellt, bei der jedes Granulat aus der natürlichen harmonischen Reihe hergestellt wurde. Ich denke, es wurde Resonanzsynthese genannt.
Im Grunde geht es darum, die Informationen in mehrere "Bits" zu zerlegen. Das tatsächliche Audiosignal ist ein zeitlich variierender "Wert", jedoch ist es oft nützlich, ihn in einer anderen Form zu betrachten. Betrachten Sie als Analogie die Zahl 256
: Je nachdem, was Sie mit Ihren Zahlen tun, kann es nützlich sein, die Zahl als 200 + 50 + 6
, oder 16 + 240
, oder 16*16
oder vielleicht als zu behandeln 2^8
. Es gibt unendlich viele Möglichkeiten, die Zahl zu behandeln, und welche Sie verwenden, hängt davon ab, was Sie erreichen möchten.
Die 'Frequenzbereichsdarstellung' ist ein Beispiel für die obige Aufschlüsselung, jedoch mit einem Signal anstelle einer Zahl. In diesem Fall stellen Sie das ursprüngliche Signal als Summe von Sinuskurven mit unterschiedlichen Frequenzen, Amplituden und Phasen dar. Wenn Sie alle addieren, erhalten Sie Ihr ursprüngliches Signal zurück. Alternativ können Sie es auch anders darstellen, z. B. mit Wavelets oder einem anderen Ansatz, der (noch) nicht einmal einen Namen hat, wenn dies für das, was Sie damit tun, nützlich ist. Vielleicht könnten Sie es in 3-Sekunden-Blöcke aufteilen, dann das Signal in jedem dieser Blöcke neu anordnen, um es monoton zu erhöhen, und sich daran erinnern, wie Sie sie neu angeordnet haben. Das klingt ein bisschen lächerlich, aber es gibt einen Ansatz, um MRT-Bilder mit dieser Art der Neuordnung zu manipulieren (es wird nicht der Chunking-Teil verwendet,
Ein Vorteil von Sinuskurven ist, dass sie sich, wie Nathan Day sagt, auf die Art und Weise beziehen, wie unsere Ohren die Tonhöhe interpretieren. Ein wichtigerer Grund ist jedoch, dass Sinuskurven komplexe Exponentiale sind, die Eigenfunktionen linearer Systeme sind. Das heißt, lineare Systeme sind viel einfacher zu analysieren, wenn Sie die Ein- und Ausgänge als Summen von Sinuskurven betrachten. Dies ist der Hauptgrund, warum die Fourier-Analyse so weit verbreitet und wichtig ist.
Kurze Antwort auf Ihre Frage: Es gibt unendlich viele Domänen, in denen Sie ein Audiosignal darstellen können. Eine weitere beliebte finden Sie unter Wavelets.