Statistiken und Big Data data-transformation

5

Wie ändere ich Daten zwischen Breit- und Langformaten in R? [geschlossen]

Sie können Daten im Breit- oder Langformat haben. Dies ist sehr wichtig, da die verwendbaren Methoden je nach Format unterschiedlich sind. Ich weiß, dass Sie mit melt()und cast()aus dem Umgestaltungspaket arbeiten müssen, aber es scheint einige Dinge zu geben, die ich nicht verstehe. Kann mir jemand einen kurzen Überblick geben, …

32 data-transformation r

4

Analyse mit komplexen Daten, etwas anderes?

Angenommen, Sie erstellen ein lineares Modell, aber die Daten sind komplex.yyy y=xβ+ϵy=xβ+ϵ y = x \beta + \epsilon Mein Datensatz ist komplex, da alle Zahlen in die Form . Gibt es verfahrenstechnische Unterschiede bei der Arbeit mit solchen Daten?yyy(a+bi)(a+bi)(a + bi) Ich frage, weil Sie am Ende komplexe Kovarianzmatrizen und …

31 regression anova data-transformation complex-numbers

2

Was sind die Annahmen einer negativen binomischen Regression?

Ich arbeite mit einem großen Datensatz (vertraulich, daher kann ich nicht zu viel teilen) und bin zu dem Schluss gekommen, dass eine negative binomische Regression erforderlich wäre. Ich habe noch nie zuvor eine glm-Regression durchgeführt, und ich kann keine klaren Informationen über die Annahmen finden. Sind sie für MLR gleich? …

30 regression generalized-linear-model data-transformation assumptions negative-binomial

3

Ist Bleaching immer gut?

Ein üblicher Vorverarbeitungsschritt für maschinelle Lernalgorithmen ist das Aufhellen von Daten. Es scheint, dass es immer gut ist, das Weißmachen durchzuführen, da die Daten dekorreliert werden, was die Modellierung vereinfacht. Wann wird Bleaching nicht empfohlen? Hinweis: Ich beziehe mich auf die Dekorrelation der Daten.

27 data-transformation

2

Variablen für multiple Regression in R transformieren

Ich versuche, eine multiple Regression in durchzuführen R. Meine abhängige Variable hat jedoch das folgende Diagramm: Hier ist eine Streudiagramm-Matrix mit allen meinen Variablen ( WARist die abhängige Variable): Ich weiß, dass ich eine Transformation für diese Variable (und möglicherweise für die unabhängigen Variablen?) Durchführen muss, bin mir jedoch nicht …

26 r regression multiple-regression data-transformation

4

Wann muss eine Zeitreihe protokolliert werden, bevor ein ARIMA-Modell angepasst wird?

Ich habe vorher Forecast Pro verwendet, um univariate Zeitreihen zu prognostizieren, schalte aber meinen Workflow auf R um. Das Prognosepaket für R enthält viele nützliche Funktionen, aber eines tut es nicht, bevor es automatisch ausgeführt wird .arima (). In einigen Fällen beschließt Forecast Pro, Transformationsdaten zu protokollieren, bevor Prognosen erstellt …

26 r time-series data-transformation forecasting arima

3

Wie man diese ungerade Verteilung modelliert (fast ein umgekehrtes J)

Die unten angezeigte abhängige Variable passt nicht zu einer mir bekannten Aktienverteilung. Die lineare Regression erzeugt nicht ganz normale, rechtsgerichtete Residuen, die sich auf ungerade Weise auf das vorhergesagte Y beziehen (2. Diagramm). Irgendwelche Vorschläge für Transformationen oder andere Wege, um die validesten Ergebnisse und die beste Vorhersagegenauigkeit zu erzielen? …

25 regression multiple-regression data-transformation censoring

7

Warum wird beispielsweise das Geschlecht in der Regel mit 0/1 anstatt mit 1/2 codiert?

Ich verstehe die Logik der Codierung für die Datenanalyse. Meine Frage unten ist die Verwendung eines bestimmten Codes. Gibt es einen Grund, warum das Geschlecht häufig als 0 für weiblich und 1 für männlich kodiert wird? Warum wird diese Kodierung als "Standard" angesehen? Vergleichen Sie dies mit Female = 1 …

25 data-transformation binary-data categorical-encoding units

3

Spaltenweise Matrixnormalisierung in R [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 6 Jahren . Ich möchte eine Matrix in R spaltenweise normalisieren. Bei einer gegebenen Matrix mmöchte ich jede …

25 r data-transformation normalization matrix

3

Warum werden beim maschinellen Lernen keine Leistungs- oder Protokolltransformationen gelehrt?

Maschinelles Lernen (ML) verwendet stark lineare und logistische Regressionstechniken. Es stützt sich auch auf Feature - Engineering - Techniken ( feature transform, kernelusw.). Warum wird in ML nichts über variable transformation(zB power transformation) erwähnt? (Ich höre zum Beispiel nie davon, Stamm- oder Protokolldaten für Features zu verwenden, normalerweise werden nur …

24 regression machine-learning data-transformation

6

Beispiele für erweiterte Regressionsmodellierung

Ich suche eine erweiterte Fallstudie zur linearen Regression, die die erforderlichen Schritte zur Modellierung komplexer, mehrfacher nichtlinearer Beziehungen mithilfe von GLM oder OLS veranschaulicht. Es ist überraschend schwierig, Ressourcen zu finden, die über grundlegende Schulbeispiele hinausgehen: Die meisten Bücher, die ich gelesen habe, gehen nicht weiter als eine logarithmische Transformation …

22 multiple-regression generalized-linear-model data-transformation splines nonlinear

4

Transformation zur Erhöhung der Kurtosis und der Schräglage von normalem Wohnmobil

Ich arbeite an einem Algorithmus, der auf der Tatsache beruht, dass Beobachtungen s normal verteilt sind, und ich möchte die Robustheit des Algorithmus anhand dieser Annahme empirisch testen.YYY Dazu suchte ich nach einer Folge von Transformationen , die die Normalität von Y zunehmend stören würden . Zum Beispiel , wenn …

20 data-transformation normality-assumption skewness kurtosis

3

Wie werden Regressionskoeffizienten interpretiert, wenn die Antwort durch die 4. Wurzel transformiert wurde?

1/4Aufgrund der Heteroskedastizität verwende ich die vierte root ( ) - Potenztransformation für meine Antwortvariable. Jetzt bin ich mir jedoch nicht sicher, wie ich meine Regressionskoeffizienten interpretieren soll. Ich gehe davon aus, dass ich die Koeffizienten bei der Rücktransformation auf die vierte Potenz bringen müsste (siehe unten Regressionsausgabe). Alle Variablen …

20 regression data-transformation

6

Ändern der Skalierung einer Variablen auf 0-100

Ich habe einen Sozialkapitalindex mit PCA-Technik erstellt. Dieser Index umfasst sowohl positive als auch negative Werte. Ich möchte diesen Index in eine Skala von 0-100 umwandeln, um die Interpretation zu vereinfachen. Bitte schlagen Sie mir den einfachsten Weg vor.

20 data-transformation scales

2

Proportionsdaten transformieren: Wenn Bögen in Quadratwurzel nicht ausreichen

Gibt es eine (stärkere?) Alternative zur Arcsin-Quadratwurzel-Transformation für Prozent- / Proportionsdaten? In dem Datensatz, an dem ich gerade arbeite, bleibt eine ausgeprägte Heteroskedastizität bestehen, nachdem ich diese Transformation angewendet habe, dh die Darstellung der Residuen gegenüber den angepassten Werten ist immer noch sehr rhomboid. Bearbeitet, um auf Kommentare zu antworten: …

20 data-transformation generalized-linear-model heteroscedasticity

Als «data-transformation» getaggte Fragen