Ich suche eine erweiterte Fallstudie zur linearen Regression, die die erforderlichen Schritte zur Modellierung komplexer, mehrfacher nichtlinearer Beziehungen mithilfe von GLM oder OLS veranschaulicht. Es ist überraschend schwierig, Ressourcen zu finden, die über grundlegende Schulbeispiele hinausgehen: Die meisten Bücher, die ich gelesen habe, gehen nicht weiter als eine logarithmische Transformation der Antwort in Verbindung mit einer BoxCox mit einem Prädiktor oder einem natürlichen Spline im besten Fall. Außerdem haben alle Beispiele, die ich bisher gesehen habe, jedes Datentransformationsproblem in einem separaten Modell behandelt, häufig in einem einzelnen Prädiktormodell.
Ich weiß, was eine BoxCox- oder YeoJohnson-Transformation ist. Was ich suche, ist eine detaillierte, reale Fallstudie, bei der die Reaktion / Beziehung nicht eindeutig ist. Die Antwort ist beispielsweise nicht unbedingt positiv (Sie können also weder log noch BoxCox verwenden), die Prädiktoren haben nichtlineare Beziehungen untereinander und zur Antwort, und die maximale Wahrscheinlichkeit von Datentransformationen scheint keinen Standard von 0,33 zu implizieren oder 0,5 Exponent. Auch die Restvarianz ist nicht konstant (niemals), so dass auch die Antwort transformiert werden muss und Entscheidungen zwischen einer nicht standardmäßigen GLM-Familienregression oder einer Antworttransformation getroffen werden müssen. Der Forscher wird wahrscheinlich Entscheidungen treffen, um eine Überanpassung der Daten zu vermeiden.
BEARBEITEN
Bisher habe ich folgende Ressourcen gesammelt:
- Regressionsmodellierungsstrategien, F. Harrell
- Angewandte ökonometrische Zeitreihen, W. Enders
- Dynamische lineare Modelle mit R, G. Petris
- Angewandte Regressionsanalyse, D. Kleinbaum
- Eine Einführung in das statistische Lernen, G. James / D. Witten
Ich habe nur das letzte (ISLR) gelesen und es ist ein sehr guter Text (5 fünf Sterne auf meiner Uhr), obwohl er sich mehr an ML als an fortgeschrittener Regressionsmodellierung orientiert.
Es gibt auch diesen guten Beitrag im Lebenslauf, der einen herausfordernden Regressionsfall darstellt.