Erstellen aussagekräftiger und nützlicher grafischer Darstellungen von Daten. (Wenn es bei Ihrer Frage nur darum geht, wie bestimmte Software einen bestimmten Effekt erzeugt, ist sie hier wahrscheinlich nicht thematisch.)
Ich arbeite mit einem kleinen Datensatz (21 Beobachtungen) und habe den folgenden normalen QQ-Plot in R: Was kann ich angesichts der Tatsache, dass die Darstellung keine Normalität unterstützt, auf die zugrunde liegende Verteilung schließen? Es scheint mir, dass eine Verteilung, die mehr nach rechts geneigt ist, besser passt, stimmt das? …
Angenommen, ich möchte anhand eines Histogramms sehen, ob meine Daten exponentiell sind (dh nach rechts verschoben sind). Abhängig davon, wie ich die Daten gruppiere oder bin, kann es zu sehr unterschiedlichen Histogrammen kommen. Ein Satz von Histogrammen wird den Anschein erwecken, dass die Daten exponentiell sind. Ein anderer Satz wird …
Wurde eine Studie durchgeführt, um festzustellen, welche Farben am besten geeignet sind, um mehrere Serien auf demselben Plot darzustellen? Ich habe gerade die Standardeinstellungen verwendet matplotlibund sie sehen ein wenig kindisch aus, da sie alle helle Primärfarben sind.
Ich hatte eine Frage zur Interpretation der durch plot (lm) in R erzeugten Graphen. Ich habe mich gefragt, ob Sie mir sagen können, wie die Diagramme für die Skalenposition und die Hebelwirkung für die verbleibenden Graphen zu interpretieren sind. Über Kommentare würde ich mich freuen. Grundkenntnisse in Statistik, Regression und …
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
Ich benutze R, um K-bedeutet Clustering zu machen. Ich verwende 14 Variablen, um K-means auszuführen Was ist ein hübscher Weg, um die Ergebnisse von K-means zu zeichnen? Gibt es bereits Implementierungen? Erschweren 14 Variablen das Zeichnen der Ergebnisse? Ich habe etwas namens GGcluster gefunden, das cool aussieht, sich aber noch …
Für eine Simulationsstudie muss ich Zufallsvariablen generieren, die eine vorab festgelegte (Populations-) Korrelation zu einer vorhandenen Variablen .Y.YY Ich sah in die RPakete copulaund CDVineder Zufall multivariate Verteilungen mit einer bestimmten Abhängigkeitsstruktur erzeugen kann. Es ist jedoch nicht möglich, eine der resultierenden Variablen an eine vorhandene Variable zu binden. Anregungen …
Die kanonische Korrelationsanalyse (CCA) ist eine Technik im Zusammenhang mit der Hauptkomponentenanalyse (PCA). Während es einfach ist, PCA oder lineare Regression mithilfe eines Streudiagramms zu lehren (siehe einige tausend Beispiele zur Google-Bildsuche), habe ich für CCA kein ähnliches intuitives zweidimensionales Beispiel gesehen. Wie erklärt man visuell, was lineares CCA bewirkt?
Jeder hat Bibliotheks- oder Codevorschläge, wie man tatsächlich ein paar Beispielbäume plottet : getTree(rfobj, k, labelVar=TRUE) (Ja, ich weiß, Sie sollten dies nicht operativ tun, RF ist eine Blackbox usw. usw. Ich möchte einen Baum visuell auf Fehler überprüfen, um festzustellen, ob sich Variablen nicht intuitiv verhalten Wie gut funktionieren …
Ich habe ein Diagramm in ggplot2 erstellt, um Daten aus einem Datensatz mit 2 x 4 x 3 Zellen zusammenzufassen. Ich war in der Lage, Panels für die 2-stufige Variable mit facet_grid(. ~ Age)zu erstellen und die x- und y-Achse mit einzustellen aes(x=4leveledVariable, y=DV). aes(group=3leveledvariable, lty=3leveledvariable)Bisher habe ich die Handlung …
Ich habe gelesen, dass die Verwendung von Protokollskalen für Diagramme / Grafiken unter bestimmten Umständen angemessen ist, wie z. B. die y-Achse in einem Zeitreihendiagramm. Es ist mir jedoch nicht gelungen, eine endgültige Erklärung dafür zu finden, warum dies der Fall ist oder wann dies sonst angebracht wäre. Denken Sie …
Hat jemand Erfahrung mit Software (am besten kostenlos, am besten Open Source), die ein Bild von Daten aufnimmt, die auf kartesischen Koordinaten aufgezeichnet sind (ein normaler, alltäglicher Plot), und die Koordinaten der Punkte extrahiert, die in der Grafik aufgezeichnet sind? Dies ist im Wesentlichen ein Data-Mining-Problem und ein umgekehrtes Datenvisualisierungsproblem.
Ich habe Tukeys Buch "Exploratory Data Analysis" gelesen. Das Buch wurde 1977 geschrieben und konzentriert sich auf Papier / Bleistift-Methoden. Gibt es einen "moderneren" Nachfolger, der berücksichtigt, dass wir jetzt große Datenmengen sofort zeichnen können?
Ich habe die Daten eines Tests, mit dem sich normale und Tumorzellen unterscheiden lassen. Laut ROC-Kurve sieht es für diesen Zweck gut aus (Fläche unter der Kurve ist 0,9): Meine Fragen sind: Wie wird der Grenzwert für diesen Test und sein Konfidenzintervall bestimmt, in dem die Messwerte als nicht eindeutig …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.