Statistiken und Big Data data-transformation

3

Express-Antworten in Bezug auf Originaleinheiten in Box-Cox-transformierten Daten

Für einige Messungen werden die Ergebnisse einer Analyse auf der transformierten Skala angemessen dargestellt. In den meisten Fällen ist es jedoch wünschenswert, die Ergebnisse auf der ursprünglichen Messskala darzustellen (ansonsten ist Ihre Arbeit mehr oder weniger wertlos). Beispielsweise tritt bei log-transformierten Daten ein Problem bei der Interpretation auf der ursprünglichen …

13 data-transformation confidence-interval t-test interpretation

5

SVD-Dimensionsreduktion für Zeitreihen unterschiedlicher Länge

Ich verwende Singular Value Decomposition als Methode zur Reduzierung der Dimensionalität. Bei gegebenen NVektoren der Dimension Dbesteht die Idee darin, die Merkmale in einem transformierten Raum unkorrelierter Dimensionen darzustellen, der die meisten Informationen der Daten in den Eigenvektoren dieses Raums in abnehmender Reihenfolge der Wichtigkeit verdichtet. Jetzt versuche ich, dieses …

13 time-series machine-learning pca data-transformation multivariate-analysis

1

Wie hängt die Entropie von Ort und Maßstab ab?

Die Entropie einer stetigen Verteilung mit der Dichtefunktion fff ist definiert als das Negative der Erwartung von und ist daher gleichlog(f),log⁡(f),\log(f), Hf=−∫∞−∞log(f(x))f(x)dx.Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Wir sagen auch, dass jede Zufallsvariable deren Verteilung die Dichte hat, die Entropie (Dieses Integral ist auch dann gut definiert, wenn Nullen hat, weil …

13 distributions data-transformation entropy

4

Ein Regressionsmodell, dessen Antwortvariable der Tag des Jahres ist, an dem (normalerweise) ein jährliches Ereignis auftritt

In diesem speziellen Fall beziehe ich mich auf den Tag, an dem ein See gefriert. Dieses "Ice-On" -Datum tritt nur einmal im Jahr auf, aber manchmal überhaupt nicht (wenn der Winter warm ist). In einem Jahr kann der See an Tag 20 (20. Januar) einfrieren und in einem anderen Jahr …

13 regression time-series survival data-transformation recurrent-events

2

Reicht die Visualisierung aus, um Daten zu transformieren?

Problem Ich möchte die Varianz, die durch jeden der 30 Parameter erklärt wird, als Balkendiagramm mit einem anderen Balken für jeden Parameter und die Varianz auf der y-Achse darstellen: Die Abweichungen sind jedoch stark in Richtung kleiner Werte, einschließlich 0, verzerrt, wie im folgenden Histogramm zu sehen ist: Wenn ich …

13 data-visualization data-transformation histogram

1

Werden Root-Transformationen empfohlen?

Mein Kollege möchte einige Daten analysieren, nachdem er die Antwortvariable transformiert hat, indem er sie auf die Potenz von (d. ).1818\frac18y0.125y0.125y^{0.125} Das ist mir unangenehm, aber ich habe Mühe zu erklären, warum. Ich kann mir keine mechanistischen Gründe für diese Transformation vorstellen. Ich habe es noch nie zuvor gesehen, und …

12 regression data-transformation aic

1

Wie lassen sich Proportionen am besten transformieren, wenn sie eine unabhängige Variable sind?

Ich dachte, ich hätte dieses Problem verstanden, aber jetzt bin ich mir nicht so sicher und würde es gerne mit anderen klären, bevor ich fortfahre. Ich habe zwei Variablen Xund Y. Yist ein Verhältnis, und es ist nicht durch 0 und 1 begrenzt und ist im Allgemeinen normalverteilt. Xist ein …

12 r regression data-transformation nonlinear-regression proportion

4

Hinweise darauf, dass ein Problem für die lineare Regression gut geeignet ist

Ich lerne die lineare Regression mithilfe der Einführung in die lineare Regressionsanalyse von Montgomery, Peck und Vining . Ich möchte ein Datenanalyseprojekt auswählen. Ich habe den naiven Gedanken, dass eine lineare Regression nur dann geeignet ist, wenn man vermutet, dass es lineare funktionale Beziehungen zwischen erklärenden Variablen und der Antwortvariablen …

12 regression data-transformation model linear regression-strategies

2

Führen normalverteiltes X und Y eher zu normalverteilten Residuen?

Hier wird die Fehlinterpretation der Annahme der Normalität in der linearen Regression diskutiert (die 'Normalität' bezieht sich eher auf das X und / oder Y als auf die Residuen), und das Poster fragt, ob es möglich ist, nicht normalverteiltes X und Y zu haben und haben noch normalverteilte Residuen. Meine …

12 regression normal-distribution data-transformation residuals assumptions

3

Wie verwandle ich die leptokurtische Verteilung in Normalität?

Angenommen, ich habe eine leptokurtische Variable, die ich in Normalität umwandeln möchte. Welche Transformationen können diese Aufgabe erfüllen? Mir ist durchaus bewusst, dass die Umwandlung von Daten nicht immer wünschenswert ist, aber als akademische Maßnahme möchte ich die Daten in die Normalität "hämmern". Wie Sie aus der Grafik ersehen können, …

12 normal-distribution data-transformation kurtosis qq-plot

1

Kriterien für die Auswahl des „besten“ Modells in einem Hidden-Markov-Modell

Ich habe einen Zeitreihendatensatz, an den ich ein Hidden Markov Model (HMM) anpasse, um die Anzahl der latenten Zustände in den Daten abzuschätzen. Mein Pseudocode dafür ist der folgende: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... …

12 r aic hidden-markov-model bic spss manova time-series r lme4-nlme regression modeling negative-binomial bayesian bugs state-space-models hypothesis-testing data-transformation factor-analysis sem

2

Kovarianz transformierter Zufallsvariablen

Ich habe zwei Zufallsvariablen X>0X>0X > 0 und Y>0Y>0Y > 0 . Wenn ich Cov(X,Y),Cov(X,Y),\text{Cov}(X, Y), abschätzen kann , wie kann ich Cov ( log ( X ) , log ( Y ) ) abschätzen ?Cov(log(X),log(Y))?Cov(log⁡(X),log⁡(Y))?\text{Cov}(\log(X), \log(Y))?

12 data-transformation covariance random-variable

1

Warum sollten Sie protokollierte Variablen verwenden?

Wahrscheinlich ist dies eine sehr grundlegende Frage, aber ich bin nicht in der Lage, eine solide Antwort darauf zu finden. Ich hoffe hier kann ich. Ich lese gerade Artikel als Vorbereitung für meine eigene Masterarbeit. Derzeit lese ich einen Artikel, der die Beziehung zwischen Tweets und Börsenmerkmalen untersucht. In einer …

12 correlation data-transformation logarithm

2

Was ist zu tun, wenn einige Zeitpunkte stark verzerrte Antworten aufweisen und andere nicht in einer Studie mit wiederholten Messungen enthalten sind?

Wenn man in einem longitudinalen Design auf kontinuierliche, aber verzerrte Ergebnismaße stößt (z. B. mit einem Zwischensubjekteffekt), besteht der übliche Ansatz darin, das Ergebnis in Normalität umzuwandeln. Wenn die Situation extrem ist, wie beispielsweise bei abgeschnittenen Beobachtungen, kann man sich vorstellen, ein Tobit-Wachstumskurvenmodell oder ein ähnliches zu verwenden. Aber ich …

12 repeated-measures data-transformation skewness

4

Verwenden von Dezibel in Statistiken

Ich arbeite an einem Projekt, bei dem RFID-Tags gelesen und die Signalstärke verglichen werden, die der Leser sieht, wenn Sie die Antennenkonfiguration ändern (Anzahl der Antennen, Position usw.). Im Rahmen des Projekts muss ich die Setups vergleichen, um festzustellen, welche am effektivsten sind. Idealerweise könnte ich entweder einen ungepaarten t-Test …

11 data-transformation linear-model descriptive-statistics

Als «data-transformation» getaggte Fragen