Gegeben eine Menge von Instanzen. Für jede Instanz habe ich einen Merkmalsvektor bestehend aus (numerische) Merkmale (, , ...,), n >> m. Außerdem habe ich für jeden Fall eine numerische Punktzahl(beobachtbar). Ich würde gerne:
- Finden Sie heraus, welche Teilmenge von Merkmalen oder eine lineare Kombination davon die Ergebnisse am besten erklärt.
- Erstellen Sie dazu eine schöne Visualisierung.
Ich wurde auf die Hauptkomponentenanalyse (PCA) hingewiesen. Das Problem mit PCA ist, dass nur die Merkmalsvektoren berücksichtigt werden. PCA bezieht die Merkmale nicht auf die numerische Bewertung.
Praktische Anwendung: Angesichts einer großen Anzahl von Problemfällen (z. B. Probleme mit Handlungsreisenden) und eines Algorithmus zur Lösung des Problems. Jedes Mal, wenn wir die Instanz lösen, können wir die Gesamtzeit (= Punktzahl) messen, die zum Lösen der Instanz benötigt wurde. Darüber hinaus können wir für jede Instanz eine Reihe von Merkmalen erhalten, z. B. Größe der Instanz, Graphendurchmesser usw. Welche dieser Merkmale erklären die Rechenzeit am besten?