Ich bin gespannt auf wiederholbare Verfahren , die verwendet werden können , die funktionale Form der Funktion zu entdecken , y = f(A, B, C) + error_term
wo meine einzige Eingabe eine Reihe von Beobachtungen ist ( y
, A
, B
und C
). Bitte beachten Sie, dass die Funktionsform f
unbekannt ist.
Betrachten Sie den folgenden Datensatz:
AA BB CC DD EE FF == == == == == == 98 11 66 84 67 10500 71 44 48 12 47 7250 54 28 90 73 95 5463 34 95 15 45 75 2581 56 37 0 79 43 3221 68 79 1 65 9 4721 53 2 90 10 18 3095 38 75 41 97 40 4558 29 99 46 28 96 5336 22 63 27 43 4 2196 4 5 89 78 39 492 10 28 39 59 64 1178 11 59 56 25 5 3418 10 4 79 98 24 431 86 36 84 14 67 10526 80 46 29 96 7 7793 67 71 12 43 3 5411 14 63 2 9 52 368 99 62 56 81 26 13334 56 4 72 65 33 3495 51 40 62 11 52 5178 29 77 80 2 54 7001 42 32 4 17 72 1926 44 45 30 25 5 3360 6 3 65 16 87 288
In diesem Beispiel nehmen wir an, dass wir das wissen FF = f(AA, BB, CC, DD, EE) + error term
, aber wir sind uns nicht sicher über die funktionale Form von f(...)
.
Welches Verfahren / welche Methoden würden Sie anwenden, um die funktionale Form von zu finden f(...)
?
(Bonuspunkt: Was ist Ihre beste Vermutung bei der Festlegung der f
oben genannten Daten? :-) Und ja, es gibt eine "richtige" Antwort, die R^2
über 0,99 hinausgeht.)
R^2 >= 0.99
möchte man diejenige mit dem besten Verhältnis von Leistung zu Komplexität finden (und natürlich nicht in die Stichprobe passen). Entschuldigung, dass ich diese
FF
"Verbrennungsausbeute" undAA
die Menge an Kraftstoff undBB
die Menge an Sauerstoff wären, würden Sie nach einem zusammenwirkenden Begriff vonAA
undBB