Ich habe gerade erfahren, dass die menschliche Stimme keine einzelne Sinuswelle ist, sondern eine Reihe unbegrenzter Sinuswellen mit jeweils unterschiedlichen Frequenzen.
Laut Wikipedia
Die Stimme besteht aus Geräuschen, die von einem Menschen erzeugt werden, der die Stimmlippen zum Sprechen, Singen, Lachen, Weinen, Schreien usw. verwendet. Ihre Frequenz reicht von etwa 60 bis 7000 Hz.
Wenn es sich bei der menschlichen Stimme also um ein zusammengesetztes Signal handelt, enthält sie verschiedene Frequenzbereiche zwischen 60 Hz und 7 kHz.
Angenommen, es gibt eine Gruppe von Personen, die alle zusammen dasselbe Lied singen. Jede Person hat ihre eigenen Sprachfrequenzbereiche.
Zum Beispiel,
Wenn eine Person A die folgenden Frequenzen hat: 100 Hz, 250 Hz, 6 kHz, 10 Hz, 87 Hz, 52 Hz, 2 kHz .......
und eine Person B hat die folgenden, 217Hz1, 11Hz, 12Hz, 2323Hz, 839Hz, 4KHz, 100Hz, 10Hz .....
Es muss so viele Frequenzen geben, die sowohl in der Person A als auch in der Person A ähnlich sind, wie im obigen Beispiel, dass die Frequenzen 100 Hz und 10 Hz zwischen zwei Personen gemeinsam sind.
Ich habe mir eine TV-Show mit dem Namen "Fringe" angesehen, in der die Stimme des jeweiligen Mannes aus einer Audiodatei herausgefiltert wurde, während dort auch andere Personen anwesend waren.
Wie filtern sie also genau die Stimme einer Person aus der Stimme von Hunderten von Menschen heraus, wenn es so viele Frequenzen gibt, die allen gemeinsam sind? Hat dies etwas mit den Amplituden der Frequenzen einer Person zu tun?