Kann mir bitte jemand den tatsächlichen Unterschied zwischen Regressionsanalyse und Kurvenanpassung (linear und nichtlinear) erklären, wenn möglich anhand eines Beispiels?
Es scheint, dass beide versuchen, eine Beziehung zwischen zwei Variablen (abhängig und unabhängig) zu finden und dann den Parameter (oder Koeffizienten) zu bestimmen, der den vorgeschlagenen Modellen zugeordnet ist. Zum Beispiel, wenn ich einen Datensatz habe wie:
Y = [1.000 1.000 1.000 0.961 0.884 0.000]
X = [1.000 0.063 0.031 0.012 0.005 0.000]
Kann jemand eine Korrelationsformel zwischen diesen beiden Variablen vorschlagen? Ich habe Schwierigkeiten, den Unterschied zwischen diesen beiden Ansätzen zu verstehen. Wenn Sie es vorziehen, Ihre Antwort mit anderen Datensätzen zu unterstützen, ist dies in Ordnung, da dieser schwer zu passen scheint (vielleicht nur für mich).
Der obige Datensatz stellt die und Achse einer Empfängerkennlinie (ROC) dar, wobei die wahre positive Rate (TPR) und die falsche positive Rate (FPR) ist.
Ich versuche, eine Kurve anzupassen oder eine Regressionsanalyse gemäß meiner ursprünglichen Frage durchzuführen, wobei ich noch nicht sicher bin, ob ich den TPR für einen bestimmten FPR schätzen soll (oder umgekehrt).
Ist es wissenschaftlich akzeptabel, eine solche Kurvenanpassungsfunktion zwischen zwei unabhängigen Variablen (TPR und FPR) zu finden?
Zweitens, ist es wissenschaftlich akzeptabel, eine solche Funktion zu finden, wenn ich weiß, dass die Verteilungen der tatsächlichen negativen und der tatsächlichen positiven Fälle nicht normal sind?