Als «data-transformation» getaggte Fragen

Mathematische, oft nichtlineare Reexpression von Datenwerten. Daten werden häufig transformiert, um entweder die Annahmen eines statistischen Modells zu erfüllen oder um die Ergebnisse einer Analyse besser interpretierbar zu machen.

3
Express-Antworten in Bezug auf Originaleinheiten in Box-Cox-transformierten Daten
Für einige Messungen werden die Ergebnisse einer Analyse auf der transformierten Skala angemessen dargestellt. In den meisten Fällen ist es jedoch wünschenswert, die Ergebnisse auf der ursprünglichen Messskala darzustellen (ansonsten ist Ihre Arbeit mehr oder weniger wertlos). Beispielsweise tritt bei log-transformierten Daten ein Problem bei der Interpretation auf der ursprünglichen …

5
SVD-Dimensionsreduktion für Zeitreihen unterschiedlicher Länge
Ich verwende Singular Value Decomposition als Methode zur Reduzierung der Dimensionalität. Bei gegebenen NVektoren der Dimension Dbesteht die Idee darin, die Merkmale in einem transformierten Raum unkorrelierter Dimensionen darzustellen, der die meisten Informationen der Daten in den Eigenvektoren dieses Raums in abnehmender Reihenfolge der Wichtigkeit verdichtet. Jetzt versuche ich, dieses …

1
Wie hängt die Entropie von Ort und Maßstab ab?
Die Entropie einer stetigen Verteilung mit der Dichtefunktion fff ist definiert als das Negative der Erwartung von und ist daher gleichlog(f),log⁡(f),\log(f), Hf=−∫∞−∞log(f(x))f(x)dx.Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Wir sagen auch, dass jede Zufallsvariable deren Verteilung die Dichte hat, die Entropie (Dieses Integral ist auch dann gut definiert, wenn Nullen hat, weil …



1
Werden Root-Transformationen empfohlen?
Mein Kollege möchte einige Daten analysieren, nachdem er die Antwortvariable transformiert hat, indem er sie auf die Potenz von (d. ).1818\frac18y0.125y0.125y^{0.125} Das ist mir unangenehm, aber ich habe Mühe zu erklären, warum. Ich kann mir keine mechanistischen Gründe für diese Transformation vorstellen. Ich habe es noch nie zuvor gesehen, und …


4
Hinweise darauf, dass ein Problem für die lineare Regression gut geeignet ist
Ich lerne die lineare Regression mithilfe der Einführung in die lineare Regressionsanalyse von Montgomery, Peck und Vining . Ich möchte ein Datenanalyseprojekt auswählen. Ich habe den naiven Gedanken, dass eine lineare Regression nur dann geeignet ist, wenn man vermutet, dass es lineare funktionale Beziehungen zwischen erklärenden Variablen und der Antwortvariablen …


3
Wie verwandle ich die leptokurtische Verteilung in Normalität?
Angenommen, ich habe eine leptokurtische Variable, die ich in Normalität umwandeln möchte. Welche Transformationen können diese Aufgabe erfüllen? Mir ist durchaus bewusst, dass die Umwandlung von Daten nicht immer wünschenswert ist, aber als akademische Maßnahme möchte ich die Daten in die Normalität "hämmern". Wie Sie aus der Grafik ersehen können, …

1
Kriterien für die Auswahl des „besten“ Modells in einem Hidden-Markov-Modell
Ich habe einen Zeitreihendatensatz, an den ich ein Hidden Markov Model (HMM) anpasse, um die Anzahl der latenten Zustände in den Daten abzuschätzen. Mein Pseudocode dafür ist der folgende: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... …



2
Was ist zu tun, wenn einige Zeitpunkte stark verzerrte Antworten aufweisen und andere nicht in einer Studie mit wiederholten Messungen enthalten sind?
Wenn man in einem longitudinalen Design auf kontinuierliche, aber verzerrte Ergebnismaße stößt (z. B. mit einem Zwischensubjekteffekt), besteht der übliche Ansatz darin, das Ergebnis in Normalität umzuwandeln. Wenn die Situation extrem ist, wie beispielsweise bei abgeschnittenen Beobachtungen, kann man sich vorstellen, ein Tobit-Wachstumskurvenmodell oder ein ähnliches zu verwenden. Aber ich …

4
Verwenden von Dezibel in Statistiken
Ich arbeite an einem Projekt, bei dem RFID-Tags gelesen und die Signalstärke verglichen werden, die der Leser sieht, wenn Sie die Antennenkonfiguration ändern (Anzahl der Antennen, Position usw.). Im Rahmen des Projekts muss ich die Setups vergleichen, um festzustellen, welche am effektivsten sind. Idealerweise könnte ich entweder einen ungepaarten t-Test …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.