Ich versuche, nicht sprachliche Geräusche zu erkennen und zu klassifizieren. Derzeit verwende ich eine Reihe von sich bewegenden überlappenden Leistungsspektren aus Trainingsgeräuschen als die Funktionen, nach denen ich suche.
Wenn ich eine Analyse durchführe, berechne ich nur die gleiche Anzahl überlappender Spektren, damit die Anzahl der Merkmale gleich ist. Im Moment ist die Leistung nicht sehr gut, sie kann nur Stille gegen Nicht-Stille erkennen.
Welche Techniken gibt es für diese Art der Signalerkennung? Eines meiner Probleme ist, dass für Sounds unterschiedlicher Länge im Zeitbereich unterschiedliche Längen von Merkmalsvektoren resultieren würden, sodass ich nicht denselben Klassifikator verwenden kann. Ich bleibe dabei.