Ich versuche, einen Satz von Gleichungen zu lösen, der 40 unabhängige Variablen (x1, ..., x40) und eine abhängige Variable (y) enthält. Die Gesamtzahl der Gleichungen (Anzahl der Zeilen) beträgt ~ 300, und ich möchte nach dem Satz von 40 Koeffizienten suchen, der den gesamten quadratischen Fehlersummen zwischen y und dem vorhergesagten Wert minimiert.
Mein Problem ist, dass die Matrix sehr dünn ist und ich nicht weiß, wie ich das Gleichungssystem mit spärlichen Daten am besten lösen kann. Ein Beispiel für den Datensatz ist unten dargestellt:
y x1 x2 x3 x4 x5 x6 ... x40
87169 14 0 1 0 0 2 ... 0
46449 0 0 4 0 1 4 ... 12
846449 0 0 0 0 0 3 ... 0
....
Ich verwende derzeit einen genetischen Algorithmus, um dies zu lösen, und die Ergebnisse werden mit einem Faktor von ungefähr zwei Unterschieden zwischen beobachtet und erwartet veröffentlicht.
Kann jemand verschiedene Methoden oder Techniken vorschlagen, die in der Lage sind, einen Satz von Gleichungen mit spärlichen Daten zu lösen.