Als «data-transformation» getaggte Fragen

Mathematische, oft nichtlineare Reexpression von Datenwerten. Daten werden häufig transformiert, um entweder die Annahmen eines statistischen Modells zu erfüllen oder um die Ergebnisse einer Analyse besser interpretierbar zu machen.



2
Was sind die Annahmen einer negativen binomischen Regression?
Ich arbeite mit einem großen Datensatz (vertraulich, daher kann ich nicht zu viel teilen) und bin zu dem Schluss gekommen, dass eine negative binomische Regression erforderlich wäre. Ich habe noch nie zuvor eine glm-Regression durchgeführt, und ich kann keine klaren Informationen über die Annahmen finden. Sind sie für MLR gleich? …

3
Ist Bleaching immer gut?
Ein üblicher Vorverarbeitungsschritt für maschinelle Lernalgorithmen ist das Aufhellen von Daten. Es scheint, dass es immer gut ist, das Weißmachen durchzuführen, da die Daten dekorreliert werden, was die Modellierung vereinfacht. Wann wird Bleaching nicht empfohlen? Hinweis: Ich beziehe mich auf die Dekorrelation der Daten.


4
Wann muss eine Zeitreihe protokolliert werden, bevor ein ARIMA-Modell angepasst wird?
Ich habe vorher Forecast Pro verwendet, um univariate Zeitreihen zu prognostizieren, schalte aber meinen Workflow auf R um. Das Prognosepaket für R enthält viele nützliche Funktionen, aber eines tut es nicht, bevor es automatisch ausgeführt wird .arima (). In einigen Fällen beschließt Forecast Pro, Transformationsdaten zu protokollieren, bevor Prognosen erstellt …

3
Wie man diese ungerade Verteilung modelliert (fast ein umgekehrtes J)
Die unten angezeigte abhängige Variable passt nicht zu einer mir bekannten Aktienverteilung. Die lineare Regression erzeugt nicht ganz normale, rechtsgerichtete Residuen, die sich auf ungerade Weise auf das vorhergesagte Y beziehen (2. Diagramm). Irgendwelche Vorschläge für Transformationen oder andere Wege, um die validesten Ergebnisse und die beste Vorhersagegenauigkeit zu erzielen? …



3
Warum werden beim maschinellen Lernen keine Leistungs- oder Protokolltransformationen gelehrt?
Maschinelles Lernen (ML) verwendet stark lineare und logistische Regressionstechniken. Es stützt sich auch auf Feature - Engineering - Techniken ( feature transform, kernelusw.). Warum wird in ML nichts über variable transformation(zB power transformation) erwähnt? (Ich höre zum Beispiel nie davon, Stamm- oder Protokolldaten für Features zu verwenden, normalerweise werden nur …

6
Beispiele für erweiterte Regressionsmodellierung
Ich suche eine erweiterte Fallstudie zur linearen Regression, die die erforderlichen Schritte zur Modellierung komplexer, mehrfacher nichtlinearer Beziehungen mithilfe von GLM oder OLS veranschaulicht. Es ist überraschend schwierig, Ressourcen zu finden, die über grundlegende Schulbeispiele hinausgehen: Die meisten Bücher, die ich gelesen habe, gehen nicht weiter als eine logarithmische Transformation …


3
Wie werden Regressionskoeffizienten interpretiert, wenn die Antwort durch die 4. Wurzel transformiert wurde?
1/4Aufgrund der Heteroskedastizität verwende ich die vierte root ( ) - Potenztransformation für meine Antwortvariable. Jetzt bin ich mir jedoch nicht sicher, wie ich meine Regressionskoeffizienten interpretieren soll. Ich gehe davon aus, dass ich die Koeffizienten bei der Rücktransformation auf die vierte Potenz bringen müsste (siehe unten Regressionsausgabe). Alle Variablen …


2
Proportionsdaten transformieren: Wenn Bögen in Quadratwurzel nicht ausreichen
Gibt es eine (stärkere?) Alternative zur Arcsin-Quadratwurzel-Transformation für Prozent- / Proportionsdaten? In dem Datensatz, an dem ich gerade arbeite, bleibt eine ausgeprägte Heteroskedastizität bestehen, nachdem ich diese Transformation angewendet habe, dh die Darstellung der Residuen gegenüber den angepassten Werten ist immer noch sehr rhomboid. Bearbeitet, um auf Kommentare zu antworten: …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.