Was ist Ihre Intuition / Interpretation einer Verteilung von Eigenwerten einer Korrelationsmatrix? Ich neige dazu zu hören, dass normalerweise 3 größte Eigenwerte am wichtigsten sind, während diejenigen nahe Null Rauschen sind. Ich habe auch einige Forschungsarbeiten gesehen, in denen untersucht wurde, wie sich natürlich vorkommende Eigenwertverteilungen von denen unterscheiden, die …
Ich habe das Modell mit optimiert caret, aber dann das Modell mit dem gbmPaket erneut ausgeführt. Nach meinem Verständnis sollten das verwendete caretPaket gbmund die Ausgabe identisch sein. Nur ein kurzer Testlauf mit data(iris)zeigt jedoch eine Diskrepanz im Modell von etwa 5% unter Verwendung von RMSE und R ^ 2 …
Bei der mehrstufigen Modellierung wird die Intraclass-Korrelation häufig aus einer ANOVA mit Zufallseffekten berechnet yich j= γ00+ uj+ eich jyichj=γ00+uj+eichj y_{ij} = \gamma_{00} + u_j + e_{ij} Dabei sind die Residuen der Ebene 2 und die Residuen der Ebene 1. Dann erhalten wir Schätzungen, und für die Varianz von und …
Für hierarchische Cluster sehe ich oft die folgenden zwei "Metriken" (sie sprechen nicht genau dafür), um den Abstand zwischen zwei Zufallsvariablen XXX und : Tut entweder Erfüllt man die Dreiecksungleichung? Wenn ja, wie soll ich es beweisen, anstatt nur eine Bruteforce-Berechnung durchzuführen? Was ist ein einfaches Gegenbeispiel, wenn es sich …
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
In Bezug auf den Titel besteht die Idee darin, die gegenseitige Information hier und nach MI zu verwenden, um die "Korrelation" (definiert als "wie viel ich über A weiß, wenn ich B weiß") zwischen einer kontinuierlichen Variablen und einer kategorialen Variablen zu schätzen. Ich werde Ihnen gleich meine Gedanken zu …
Hintergrund: Ich habe einen Artikel gelesen, in dem Autoren die Pearson-Korrelation 0,754 aus Stichprobengröße 878 berichten. Der resultierende p-Wert für den Korrelationstest ist "zwei Sterne" signifikant (dh p <0,01). Ich denke jedoch, dass bei einer so großen Stichprobengröße der entsprechende p-Wert unter 0,001 liegen sollte (dh drei Sterne signifikant). Können …
Die Korrelation rrr ist ein Maß für die lineare Assoziation zwischen zwei Variablen. Der Bestimmungskoeffizient r2r2r^2 ist ein Maß dafür, wie viel von der Variabilität in einer Variablen durch Variation in der anderen "erklärt" werden kann. Wenn zum Beispiel r=0.8r=0.8r = 0.8 die Korrelation zwischen zwei Variablen ist, dann ist …
Wahrscheinlich ist dies eine sehr grundlegende Frage, aber ich bin nicht in der Lage, eine solide Antwort darauf zu finden. Ich hoffe hier kann ich. Ich lese gerade Artikel als Vorbereitung für meine eigene Masterarbeit. Derzeit lese ich einen Artikel, der die Beziehung zwischen Tweets und Börsenmerkmalen untersucht. In einer …
Ist es möglich, eine positive Korrelation zwischen einem Regressor und einer Antwort ( +0,43) zu erhalten und anschließend einen negativen Koeffizienten im angepassten Regressionsmodell für diesen Regressor zu erhalten? Ich spreche nicht über Veränderungen im Zeichen des Regressors bei einigen Modellen. Das Koeffizientenzeichen bleibt immer erhalten. Könnten die verbleibenden Variablen …
Dies mag eine grundlegende Frage sein, aber ich habe mich gefragt, warum ein RRR Wert in einem Regressionsmodell einfach quadriert werden kann, um eine Zahl der erklärten Varianz zu erhalten. Ich verstehe, dass der RRR Koeffizient die Stärke einer Beziehung angeben kann, aber ich verstehe nicht, wie einfach das Quadrieren …
Wir zeichnen NNN Proben, jede der Größe nnn , unabhängig von einer Normalverteilung (μ,σ2)(μ,σ2)(\mu,\sigma^2) . Aus den NNN Stichproben wählen wir dann die 2 Stichproben mit der höchsten (absoluten) Pearson-Korrelation aus. Was ist der erwartete Wert dieser Korrelation? Danke [PS Das sind keine Hausaufgaben]
Betrachten Sie das folgende Diagramm: Die rote Linie (linke Achse) beschreibt das Handelsvolumen einer bestimmten Aktie. Die blaue Linie (rechte Achse) beschreibt das Twitter-Nachrichtenvolumen für diese Aktie. Zum Beispiel wurden am 9. Mai (05-09) ungefähr 1.100 Millionen Trades und 4.000 Tweets getätigt. Ich möchte berechnen, ob es eine Korrelation zwischen …
Ich habe ein Problem bei der Berechnung des Pearson-Korrelationskoeffizienten von Datensätzen mit möglicherweise null Standardabweichung (dh alle Daten haben den gleichen Wert). Angenommen, ich habe die folgenden zwei Datensätze: float x[] = {2, 2, 2, 3, 2}; float y[] = {2, 2, 2, 2, 2}; Der Korrelationskoeffizient "r" würde unter …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.