Signalverarbeitung audio

6

Was muss man wissen, um einen Software-Synthesizer zu bauen?

Für jemanden, der Erfahrung in der Softwareentwicklung hat, seine Synthesizer liebt und die [sehr] Grundlagen der digitalen Audiodarstellung kennt, sind die ersten Schritte, denen er folgen sollte, um einen Musiksynthesizer DSP-weise zu programmieren?

19 audio

3

Zeigen Sie anderen, wie ich mich selbst höre

Sooo .. Ich habe über dieses Zeug nachgedacht. Wir alle wissen, dass wir anders klingen als wir es von unserer eigenen Stimme hören. Es ist einfach herauszufinden, wie andere uns hören, indem Sie sich selbst aufnehmen und es anhören. Aber was ist umgekehrt? Gibt es eine Möglichkeit, unsere Stimme so …

18 signal-analysis audio transform

4

Bibliotheken zur Sprachaktivitätserkennung (keine Spracherkennung)

Als Reaktion auf meine vorherige Frage habe ich mich gefragt, ob es Spracherkennungsbibliotheken gibt. Unter Spracherkennung verstehe ich das Übergeben eines Audiopuffers und das Zurückholen eines Indexes, in dem die Sprache beginnt und stoppt. Wenn ich also 10 Sekunden Audio-Sampling bei 44 kHz habe, würde ich eine Reihe von Zahlen …

18 audio speech

3

menschliches Sprachrauschen Filter

Kennt jemand einen Filter, um Nicht-Sprache zu dämpfen? Ich schreibe Spracherkennungssoftware und möchte alles außer menschlicher Sprache herausfiltern. Dazu gehören Hintergrundgeräusche, Geräusche, die von einem beschissenen Mikrofon erzeugt werden, oder sogar Hintergrundmusik. Ich habe bereits einen Filter erster Ordnung implementiert, der die Abnahme des Leistungsspektrums um 6 dB kompensiert, höre …

17 filters audio noise speech-recognition

1

Ich habe einige Wochen lang experimentiert, um einen Weg zu finden, ähnliche Songs in einer Bibliothek mit verschiedenen Musikrichtungen zu finden. Mein erster Versuch war, Features wie Tempo oder wie viel Bass in Songs vorhanden sind, um Gruppen zu bilden, aber ich bin mit diesem Ansatz (Volume Changes Based Beat …

16 audio fft music

2

Wie extrahiert man einen Gesangsteil aus einem Stereo-Audiosignal?

Ich verarbeite jetzt eine MP3-Datei und stoße auf dieses Problem. Mein MP3 ist stereo codiert. Was ich tun möchte, ist, den Gesangsteil für die weitere Verarbeitung zu extrahieren (egal, welcher Modus von Ausgangssignalen, Mono oder Stereo, beide in Ordnung sind). Soweit ich weiß, wird Audio in MP3 in verschiedene getrennte …

15 audio downsampling mp3 background-subtraction

4

Niedrigere Frequenzen stärker in der FFT?

Ich berechne die FFT aus dem Mikrofoneingang. Ich bemerke, dass niedrigere Frequenzen immer mehr Leistung (höhere dB) als höhere Frequenzen zu haben scheinen. Ich schneide die Daten in Frames von 24576 Bytes (4096 * 6). Hamming-Fenster anwenden: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); Führen Sie es durch FFTW Process1D(). Konvertieren …

15 audio fft

4

Merkmalsextraktion zur Klangklassifizierung

Ich versuche, Features aus einer Sounddatei zu extrahieren und den Sound einer bestimmten Kategorie zuzuordnen (z. B. Hunderinde, Fahrzeugmotor usw.). Ich möchte Klarheit über die folgenden Dinge: 1) Ist das überhaupt machbar? Es gibt Programme, die Sprache erkennen und zwischen verschiedenen Arten von Hunderinde unterscheiden können. Aber ist es möglich, …

15 audio mfcc machine-learning classification sound-recognition

1

Abrufen der Lautstärke eines Titels mit RMS

Ich versuche, die Lautstärke einer Audiospur zu berechnen, die ich in einem Puffer gespeichert habe. Der Puffer enthält PCM-Daten des Signals und ich möchte mit Root Mean Squared ermitteln, wie laut es ist. Ich gehe davon aus, dass ich dies im Zeitbereich tun kann, anstatt in den Frequenzbereich wechseln zu …

15 audio discrete-signals

2

Wann setzt die Lachspur ein?

Eines meiner Wochenendprojekte hat mich in die Tiefe der Signalverarbeitung geführt. Wie bei allen meinen Code-Projekten, für die etwas Hochleistungs-Mathematik erforderlich ist, bin ich mehr als erfreut, trotz fehlender theoretischer Grundlagen den Weg zu einer Lösung zu finden, aber in diesem Fall habe ich keine und würde gerne einen Rat …

14 audio sound-recognition

4

Effizienteste Methode zum Extrahieren von Frequenzkomponenten eines Audiosignals mit nahezu menschlicher Genauigkeit in Echtzeit

Ich versuche herauszufinden, wie (wenn möglich) die Frequenzkomponenten eines beliebigen Audio-Samples (normalerweise Musik) auf eine FFT-ähnliche Art und Weise extrahiert werden können. Bei meinen Untersuchungen zum FFT-Algorithmus habe ich jedoch herausgefunden, dass er darunter leidet strenge Einschränkungen für diesen Zweck. Es gibt 3 Probleme, die die FFT aufwirft: Da die …

14 fft audio frequency music real-time

4

Scipy - Audioverarbeitung

Ich suche gute Werkzeuge für die Audiosignalverarbeitung. zB Sprach- und Musikanalyse, automatische Spracherkennung usw. Bietet die Scipy-Bibliothek Funktionen für die Audioverarbeitung? Hat es ein gutes Werkzeug für die Audiosignalverarbeitung? Können Sie bitte ein Tool dafür vorschlagen?

14 audio python signal-detection

2

Welches Bandpassfilterdesign liefert die kürzeste Impulsantwort?

Das Entwerfen eines einfachen IIR-Bandpass-Buterworth-Filters 2. Ordnung mit einer Mittenfrequenz von 500 Hz und einer Bandbreite von 1 Oktave gibt mir den folgenden Frequenzgang ... Wenn ich nun die Impulsantwort nehme und normiere und in dB umwandle, können wir den Abfall der Impulsantwort beobachten . Die Abnahme der Impulsantwort verläuft …

14 filters audio infinite-impulse-response impulse-response bandpass

5

Identifizieren Sie, wo das Singen in einer reinen Sprachaufnahme beginnt

Ich habe eine kleine Karaoke-App, in der ein Benutzer 4 Zeilen eines Songs mit einem Abstand von einer Sekunde zwischen den Zeilen singt. Es gibt keine Hintergrundmusik, daher ist es nur Stimme, was das Problem hoffentlich leichter zu lösen macht. Ich bin auf der Suche nach der robustesten Methode, um …

14 audio signal-detection

2

Mit welchen Methoden kann das Echo eines Audiosystems identifiziert und entfernt werden?

Hintergrund Ich entwerfe ein System, das ein einzelnes kleines Mikrofon und Lautsprecher zur Verwendung in einer Telefontypeinstellung enthält. Das einfachste Beispiel, das ich geben kann, ist ein Skype-Gespräch, bei dem Sie die Lautsprecher Ihres Computers und ein Desktop-Mikrofon verwenden. Ich mache mir Sorgen, dass der Ton aus den Lautsprechern vom …

14 audio

Als «audio» getaggte Fragen