Mathematische, oft nichtlineare Reexpression von Datenwerten. Daten werden häufig transformiert, um entweder die Annahmen eines statistischen Modells zu erfüllen oder um die Ergebnisse einer Analyse besser interpretierbar zu machen.
Sie können Daten im Breit- oder Langformat haben. Dies ist sehr wichtig, da die verwendbaren Methoden je nach Format unterschiedlich sind. Ich weiß, dass Sie mit melt()und cast()aus dem Umgestaltungspaket arbeiten müssen, aber es scheint einige Dinge zu geben, die ich nicht verstehe. Kann mir jemand einen kurzen Überblick geben, …
Angenommen, Sie erstellen ein lineares Modell, aber die Daten sind komplex.yyy y=xβ+ϵy=xβ+ϵ y = x \beta + \epsilon Mein Datensatz ist komplex, da alle Zahlen in die Form . Gibt es verfahrenstechnische Unterschiede bei der Arbeit mit solchen Daten?yyy(a+bi)(a+bi)(a + bi) Ich frage, weil Sie am Ende komplexe Kovarianzmatrizen und …
Ich arbeite mit einem großen Datensatz (vertraulich, daher kann ich nicht zu viel teilen) und bin zu dem Schluss gekommen, dass eine negative binomische Regression erforderlich wäre. Ich habe noch nie zuvor eine glm-Regression durchgeführt, und ich kann keine klaren Informationen über die Annahmen finden. Sind sie für MLR gleich? …
Ein üblicher Vorverarbeitungsschritt für maschinelle Lernalgorithmen ist das Aufhellen von Daten. Es scheint, dass es immer gut ist, das Weißmachen durchzuführen, da die Daten dekorreliert werden, was die Modellierung vereinfacht. Wann wird Bleaching nicht empfohlen? Hinweis: Ich beziehe mich auf die Dekorrelation der Daten.
Ich versuche, eine multiple Regression in durchzuführen R. Meine abhängige Variable hat jedoch das folgende Diagramm: Hier ist eine Streudiagramm-Matrix mit allen meinen Variablen ( WARist die abhängige Variable): Ich weiß, dass ich eine Transformation für diese Variable (und möglicherweise für die unabhängigen Variablen?) Durchführen muss, bin mir jedoch nicht …
Ich habe vorher Forecast Pro verwendet, um univariate Zeitreihen zu prognostizieren, schalte aber meinen Workflow auf R um. Das Prognosepaket für R enthält viele nützliche Funktionen, aber eines tut es nicht, bevor es automatisch ausgeführt wird .arima (). In einigen Fällen beschließt Forecast Pro, Transformationsdaten zu protokollieren, bevor Prognosen erstellt …
Die unten angezeigte abhängige Variable passt nicht zu einer mir bekannten Aktienverteilung. Die lineare Regression erzeugt nicht ganz normale, rechtsgerichtete Residuen, die sich auf ungerade Weise auf das vorhergesagte Y beziehen (2. Diagramm). Irgendwelche Vorschläge für Transformationen oder andere Wege, um die validesten Ergebnisse und die beste Vorhersagegenauigkeit zu erzielen? …
Ich verstehe die Logik der Codierung für die Datenanalyse. Meine Frage unten ist die Verwendung eines bestimmten Codes. Gibt es einen Grund, warum das Geschlecht häufig als 0 für weiblich und 1 für männlich kodiert wird? Warum wird diese Kodierung als "Standard" angesehen? Vergleichen Sie dies mit Female = 1 …
Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 6 Jahren . Ich möchte eine Matrix in R spaltenweise normalisieren. Bei einer gegebenen Matrix mmöchte ich jede …
Maschinelles Lernen (ML) verwendet stark lineare und logistische Regressionstechniken. Es stützt sich auch auf Feature - Engineering - Techniken ( feature transform, kernelusw.). Warum wird in ML nichts über variable transformation(zB power transformation) erwähnt? (Ich höre zum Beispiel nie davon, Stamm- oder Protokolldaten für Features zu verwenden, normalerweise werden nur …
Ich suche eine erweiterte Fallstudie zur linearen Regression, die die erforderlichen Schritte zur Modellierung komplexer, mehrfacher nichtlinearer Beziehungen mithilfe von GLM oder OLS veranschaulicht. Es ist überraschend schwierig, Ressourcen zu finden, die über grundlegende Schulbeispiele hinausgehen: Die meisten Bücher, die ich gelesen habe, gehen nicht weiter als eine logarithmische Transformation …
Ich arbeite an einem Algorithmus, der auf der Tatsache beruht, dass Beobachtungen s normal verteilt sind, und ich möchte die Robustheit des Algorithmus anhand dieser Annahme empirisch testen.YYY Dazu suchte ich nach einer Folge von Transformationen , die die Normalität von Y zunehmend stören würden . Zum Beispiel , wenn …
1/4Aufgrund der Heteroskedastizität verwende ich die vierte root ( ) - Potenztransformation für meine Antwortvariable. Jetzt bin ich mir jedoch nicht sicher, wie ich meine Regressionskoeffizienten interpretieren soll. Ich gehe davon aus, dass ich die Koeffizienten bei der Rücktransformation auf die vierte Potenz bringen müsste (siehe unten Regressionsausgabe). Alle Variablen …
Ich habe einen Sozialkapitalindex mit PCA-Technik erstellt. Dieser Index umfasst sowohl positive als auch negative Werte. Ich möchte diesen Index in eine Skala von 0-100 umwandeln, um die Interpretation zu vereinfachen. Bitte schlagen Sie mir den einfachsten Weg vor.
Gibt es eine (stärkere?) Alternative zur Arcsin-Quadratwurzel-Transformation für Prozent- / Proportionsdaten? In dem Datensatz, an dem ich gerade arbeite, bleibt eine ausgeprägte Heteroskedastizität bestehen, nachdem ich diese Transformation angewendet habe, dh die Darstellung der Residuen gegenüber den angepassten Werten ist immer noch sehr rhomboid. Bearbeitet, um auf Kommentare zu antworten: …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.