Ich arbeite an einem Projekt in Python, um ein Vogellied zu erkennen und zu klassifizieren, und ich habe mich in einer Position befunden, in der ich eine Wave-Datei in Frequenz- / Zeitdaten konvertieren muss. Dies war kein allzu großes Problem, aber um die verschiedenen Silben in Gruppen einteilen zu können, muss ich etwas schreiben, das erkennt, wenn sich die Daten zu einer bestimmten Form zusammenballen. Um Ihnen eine Vorstellung davon zu geben, wie die Daten aussehen, sehen Sie hier ein Bild davon, wie die Daten beim Plotten aussehen:
Ich brauche eine Möglichkeit, um jede einzelne Silbe (jede Form mit einem Abstand auf beiden Seiten) zu erhalten und sie entweder in einer Variablen oder in ihren eigenen Dateien zu speichern, damit ich mit SciPy die Pearson-Korrelation zwischen ihnen ausführen kann.
Ich bevorzuge auch Python, bin aber offen für das Codieren in anderen Sprachen, wenn Sie eine andere Möglichkeit haben.
Vielen Dank!