Polyphone Musiktranskription scheint derzeit kein gelöstes Problem zu sein.
Wie wäre es mit der Umkehrung eines kleinen Teils des Problems. Gibt es irgendwelche spektralen Eigenschaften (von einer STFT), die verwendet werden können, um einige musikalische Akkorde aus dem Wahrscheinlichkeitsraum zu entfernen? (z. B. enthält dieser Tonausschnitt höchstwahrscheinlich keinen C # -Akkord oder eine Art verminderten Moll-Akkord, oder dies ist eine einzelne Note, kein Akkord usw.)
Angenommen, das Audio-Snippet ist mehr oder weniger stationär (vorübergehender Angriff entfernt usw.), und es ist sehr wahrscheinlich, dass für die meisten oder alle einzelnen Noten Obertöne vorhanden sind. (Und bei dieser Frage geht es nicht um invertierte Akkorde.)