Audio oder in Bezug auf die Signalverarbeitung ist ein Audiosignal eine analoge oder digitale Darstellung von Ton, typischerweise als elektrische Spannung.
Für jemanden, der Erfahrung in der Softwareentwicklung hat, seine Synthesizer liebt und die [sehr] Grundlagen der digitalen Audiodarstellung kennt, sind die ersten Schritte, denen er folgen sollte, um einen Musiksynthesizer DSP-weise zu programmieren?
Sooo .. Ich habe über dieses Zeug nachgedacht. Wir alle wissen, dass wir anders klingen als wir es von unserer eigenen Stimme hören. Es ist einfach herauszufinden, wie andere uns hören, indem Sie sich selbst aufnehmen und es anhören. Aber was ist umgekehrt? Gibt es eine Möglichkeit, unsere Stimme so …
Als Reaktion auf meine vorherige Frage habe ich mich gefragt, ob es Spracherkennungsbibliotheken gibt. Unter Spracherkennung verstehe ich das Übergeben eines Audiopuffers und das Zurückholen eines Indexes, in dem die Sprache beginnt und stoppt. Wenn ich also 10 Sekunden Audio-Sampling bei 44 kHz habe, würde ich eine Reihe von Zahlen …
Kennt jemand einen Filter, um Nicht-Sprache zu dämpfen? Ich schreibe Spracherkennungssoftware und möchte alles außer menschlicher Sprache herausfiltern. Dazu gehören Hintergrundgeräusche, Geräusche, die von einem beschissenen Mikrofon erzeugt werden, oder sogar Hintergrundmusik. Ich habe bereits einen Filter erster Ordnung implementiert, der die Abnahme des Leistungsspektrums um 6 dB kompensiert, höre …
Ich habe einige Wochen lang experimentiert, um einen Weg zu finden, ähnliche Songs in einer Bibliothek mit verschiedenen Musikrichtungen zu finden. Mein erster Versuch war, Features wie Tempo oder wie viel Bass in Songs vorhanden sind, um Gruppen zu bilden, aber ich bin mit diesem Ansatz (Volume Changes Based Beat …
Ich verarbeite jetzt eine MP3-Datei und stoße auf dieses Problem. Mein MP3 ist stereo codiert. Was ich tun möchte, ist, den Gesangsteil für die weitere Verarbeitung zu extrahieren (egal, welcher Modus von Ausgangssignalen, Mono oder Stereo, beide in Ordnung sind). Soweit ich weiß, wird Audio in MP3 in verschiedene getrennte …
Ich berechne die FFT aus dem Mikrofoneingang. Ich bemerke, dass niedrigere Frequenzen immer mehr Leistung (höhere dB) als höhere Frequenzen zu haben scheinen. Ich schneide die Daten in Frames von 24576 Bytes (4096 * 6). Hamming-Fenster anwenden: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); Führen Sie es durch FFTW Process1D(). Konvertieren …
Ich versuche, Features aus einer Sounddatei zu extrahieren und den Sound einer bestimmten Kategorie zuzuordnen (z. B. Hunderinde, Fahrzeugmotor usw.). Ich möchte Klarheit über die folgenden Dinge: 1) Ist das überhaupt machbar? Es gibt Programme, die Sprache erkennen und zwischen verschiedenen Arten von Hunderinde unterscheiden können. Aber ist es möglich, …
Ich versuche, die Lautstärke einer Audiospur zu berechnen, die ich in einem Puffer gespeichert habe. Der Puffer enthält PCM-Daten des Signals und ich möchte mit Root Mean Squared ermitteln, wie laut es ist. Ich gehe davon aus, dass ich dies im Zeitbereich tun kann, anstatt in den Frequenzbereich wechseln zu …
Eines meiner Wochenendprojekte hat mich in die Tiefe der Signalverarbeitung geführt. Wie bei allen meinen Code-Projekten, für die etwas Hochleistungs-Mathematik erforderlich ist, bin ich mehr als erfreut, trotz fehlender theoretischer Grundlagen den Weg zu einer Lösung zu finden, aber in diesem Fall habe ich keine und würde gerne einen Rat …
Ich versuche herauszufinden, wie (wenn möglich) die Frequenzkomponenten eines beliebigen Audio-Samples (normalerweise Musik) auf eine FFT-ähnliche Art und Weise extrahiert werden können. Bei meinen Untersuchungen zum FFT-Algorithmus habe ich jedoch herausgefunden, dass er darunter leidet strenge Einschränkungen für diesen Zweck. Es gibt 3 Probleme, die die FFT aufwirft: Da die …
Ich suche gute Werkzeuge für die Audiosignalverarbeitung. zB Sprach- und Musikanalyse, automatische Spracherkennung usw. Bietet die Scipy-Bibliothek Funktionen für die Audioverarbeitung? Hat es ein gutes Werkzeug für die Audiosignalverarbeitung? Können Sie bitte ein Tool dafür vorschlagen?
Das Entwerfen eines einfachen IIR-Bandpass-Buterworth-Filters 2. Ordnung mit einer Mittenfrequenz von 500 Hz und einer Bandbreite von 1 Oktave gibt mir den folgenden Frequenzgang ... Wenn ich nun die Impulsantwort nehme und normiere und in dB umwandle, können wir den Abfall der Impulsantwort beobachten . Die Abnahme der Impulsantwort verläuft …
Ich habe eine kleine Karaoke-App, in der ein Benutzer 4 Zeilen eines Songs mit einem Abstand von einer Sekunde zwischen den Zeilen singt. Es gibt keine Hintergrundmusik, daher ist es nur Stimme, was das Problem hoffentlich leichter zu lösen macht. Ich bin auf der Suche nach der robustesten Methode, um …
Hintergrund Ich entwerfe ein System, das ein einzelnes kleines Mikrofon und Lautsprecher zur Verwendung in einer Telefontypeinstellung enthält. Das einfachste Beispiel, das ich geben kann, ist ein Skype-Gespräch, bei dem Sie die Lautsprecher Ihres Computers und ein Desktop-Mikrofon verwenden. Ich mache mir Sorgen, dass der Ton aus den Lautsprechern vom …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.