Ich habe extrem spärliche Eingaben, z. B. Positionen bestimmter Merkmale in einem Eingabebild. Darüber hinaus kann jedes Merkmal mehrere Erkennungen haben (nicht sicher, ob dies einen Einfluss auf das Design des Systems hat). Dies werde ich als k-Kanal-Binärbild mit EIN-Pixeln präsentieren, die das Vorhandensein dieses Merkmals darstellen, und umgekehrt. Wir können sehen, dass eine solche Eingabe sehr spärlich sein muss.
Gibt es also Empfehlungen für die Verwendung von Daten mit geringer Dichte mit neuronalen Netzen, insbesondere Daten, die für Erkennungen / Standorte repräsentativ sind?