Bei meiner unendlichen Suche nach Schnarchen habe ich festgestellt, dass "spektrale Flachheit" ein angemessenes Maß für die Signalqualität zu sein scheint.
Ich berechne die spektrale Ebenheit als das geometrische Mittel der Datenpunkte der FFT-Leistung geteilt durch das arithmetische Mittel derselben Punkte.
Ich berechne dann (hier eine kleine Wendung) das laufende (über 50 Bilder) arithmetische Mittel und die Standardabweichung der spektralen Ebenheit und berechne eine "normalisierte" Standardabweichung als laufende Standardabweichung geteilt durch das laufende Mittel.
Bei meinen Samples stelle ich fest, dass diese Metrik größer als etwa (bis zu 0,5 oder so), wenn der Ton "gut" ist (dh ich habe eine zuverlässige Verfolgung der Atem- / Schnarchgeräusche eines schlafenden Subjekts) und sie rutscht im Allgemeinen ab unter 0,2, wenn Audio "im Schlamm" ist. (Ich kann diese Unterscheidung etwas verbessern, indem ich einen Schwellenwert verwende, der sich mit anderen Faktoren bewegt, aber das ist vermutlich ein anderes Thema.) Ich beobachte auch, dass die Messung über 1,0 geht, wenn erhebliche Hintergrundgeräusche auftreten (z. B. wenn jemand den Raum betritt und raschelt ).
Meine grundlegende Frage lautet also: Gibt es einen Namen (jenseits der "normalisierten Standardabweichung der spektralen Ebenheit") für das, was ich messe, und kann jemand eine konzeptionelle Erklärung dafür anbieten, was die Metrik "bedeutet"?
(Ich habe ein Dutzend anderer Metriken für die Signalqualität ausprobiert, und diese scheint die bisher beste zu sein.)
Hinzugefügt: Ich sollte wahrscheinlich zugeben, dass ich keinen besonders guten konzeptionellen Überblick darüber habe, welche einfache spektrale Ebenheit gemessen wird (nur der Wikipedia-Artikel ), daher wäre jede weitere Erklärung dafür willkommen.