Audio oder in Bezug auf die Signalverarbeitung ist ein Audiosignal eine analoge oder digitale Darstellung von Ton, typischerweise als elektrische Spannung.
Erstens entschuldige ich mich, weil ich ein Softwareentwickler bin und es sehr lange her ist, dass ich mich nicht mit reiner Mathematik befasst habe, daher scheint meine Frage dumm zu sein. Ich hoffe nicht. Der Kontext ist die Tonhöhenerkennung in der Musik. Wenn Sie eine Musiknote nehmen und eine Fourier-Transformation …
Basierend auf dem, was ich gelesen habe, habe ich einen Algorithmus für die FM-Klangsynthese entwickelt. Ich bin mir nicht sicher, ob ich es richtig gemacht habe. Beim Erstellen eines Software-Synthesizer-Instruments wird eine Funktion zum Erzeugen eines Oszillators verwendet, und ein Modulator kann verwendet werden, um die Frequenz dieses Oszillators zu …
Ich versuche, nicht sprachliche Geräusche zu erkennen und zu klassifizieren. Derzeit verwende ich eine Reihe von sich bewegenden überlappenden Leistungsspektren aus Trainingsgeräuschen als die Funktionen, nach denen ich suche. Wenn ich eine Analyse durchführe, berechne ich nur die gleiche Anzahl überlappender Spektren, damit die Anzahl der Merkmale gleich ist. Im …
Mein Problem ist, dass ich die Energie des Hintergrundrauschens nicht kenne, also kann ich die Energie nicht einfach schwellen. Die Verarbeitung erfolgt in Echtzeit und ich habe ungefähr 500 ms Zeit, um mich zu entscheiden. Idealerweise möchte ich ruhige Konsonanten, die als nicht still gelten.
Ich versuche, die Hough-Transformation für die Kantenerkennung zu verwenden, und möchte Gradientenbilder als Basis verwenden. Was ich bisher das Bild gegeben getan haben , Ivon ihrer Größe [M,N]und ihrer partiellen Ableitungen gx, gyist der Steigungswinkel in jedem Pixel zu berechnen thetas = atan(gy(x,y) ./ gx. Ebenso berechne ich die Gradientengröße …
Ich habe eine Audiodatei (Sinus) 1000Hz als Eingabe für meinen FFT-Algorithmus erhalten. Ich habe 8192 Leistungsspektrum-Samples in einem Array. Was ist der beste und einfachste Weg, um zu überprüfen, ob meine Ausgabe richtig oder falsch ist? Wenn ich eine stille Audiodatei gebe, ist die Ausgabe für alle Samples Null. In …
Ich bin ziemlich neu in Java und Signalverarbeitung, aber mir wurde ein Projekt zugewiesen, das sich mit Audioverarbeitung befasst. Mein Thema ist ein Spiel, das eine Komponente zum Analysieren eines Songs (eines bestimmten Songs) enthält und Daten abhängig von der aktuell gespielten Frequenz (Echtzeit) ausgibt. dh: Während der Wiedergabe des …
Ich möchte eine Android-App entwickeln. Als Teil der Funktionalität würde die App erfordern, 3-5 Sekunden Audio zufällig abzutasten und es als menschlich sprechend zu klassifizieren oder nicht. Ich verstehe, dass dieses Konzept als Sprachaktivitätserkennung bezeichnet wird. Was wäre der beste Weg, um dies auf einem Mobiltelefon zu implementieren. Ich habe …
Bei etwa 103 Datenpunkten ( ) gibt eine DFT 103 Frequenzwerte zurück. Um dann so etwas wie das Filtern der hohen Frequenzen zu tun, müssen die Hochfrequenzwerte von der DFT auf Null gesetzt und die inverse DFT ausgeführt werden, um 103 Datenpunkte zurückzugewinnen, die das ursprüngliche Signal ohne die hohen …
Ich schreibe Software zur Verarbeitung von Audio als 16-Bit-PCM-Samples. Die erste Stufe der Verarbeitung umfasst die Berechnung der Energie (oder der Gesamtvariation) in einem bestimmten Frequenzbereich (oberhalb einer bestimmten Grenzfrequenz). Was ich gerade mache, ist das Subtrahieren der Energie des tiefpassgefilterten Signals von der Energie des ursprünglichen Signals. Ich fand …
Ich möchte einen Algorithmus implementieren, der zwei Audiospuren synchronisiert. Die beiden Spuren sind sehr ähnlich; Sie können sich vorstellen, dass es sich um zwei Tonaufnahmen (nicht unbedingt Musik) von zwei Mikrofonen im selben Raum handelt. Dies bedeutet, dass sie als ein Signal erscheinen, das zwei verschiedene (lineare) Kanäle mit unterschiedlichem …
Die nicht-negative Matrixfaktorisierung zielt darauf ab, eine Matrix in das Produkt zweier Matrizen zu faktorisieren , wobei eine Menge von Basisvektoren und deren Aktivierungen oder Gewichte darstellt. Auf die Trennung von Audioquellen angewendet, ist das Spektrogramm (das uns bekannt ist), und ist die Basis nicht negativer Spektren, ist ihre zeitliche …
Ich muss die Tonhöhe erkennen (Signalfrequenz messen), während die Musiker Musik spielen, und eine Warnung geben, wenn sie verstimmt sind, aber die Musik ist für FFT (Fast Fourier Transform) etwas zu schnell. Im Folgenden versuche ich, eine technische Beschreibung des Problems zu geben. Musiker spielen Musik mit 90-140 Schlägen pro …
Wann haben wir beschlossen, das Telefon mit kHz zu testen? War das schon immer so? Warum haben wir das gemacht? Liegt es daran, dass höhere Bitraten nicht so schnell übertragen werden können? Und zählen diese Gründe noch? Und wenn nicht, warum gibt es noch keinen neuen Standard? Stimmt es, dass …
Ich versuche, einen Algorithmus zu schreiben, der automatisch ein Stück Audio mit Vogelrufaufzeichnungen segmentiert. Meine Eingabedaten sind Wave-Dateien mit einer Länge von 1 Minute. Für die Ausgabe möchte ich separate Aufrufe zur weiteren Analyse erhalten. Das Problem ist, dass das Signal-Rausch-Verhältnis aufgrund der Umgebungsbedingungen und der schlechten Qualität eines Mikrofons …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.