Als «data-visualization» getaggte Fragen

Erstellen aussagekräftiger und nützlicher grafischer Darstellungen von Daten. (Wenn es bei Ihrer Frage nur darum geht, wie bestimmte Software einen bestimmten Effekt erzeugt, ist sie hier wahrscheinlich nicht thematisch.)


4
Soll ich zum Zeichnen mit R ggplot2 oder ggvis lernen?
Soll ich zum Zeichnen mit R ggplot2 oder ggvis lernen? Ich möchte nicht unbedingt beides lernen, wenn einer von ihnen in irgendeiner Hinsicht überlegen ist. Warum erstellt die R-Community immer wieder neue Pakete mit überlappenden Funktionen? In dem einleitenden Blogpost wird kein Wort darüber verloren, warum ggvis erstellt wird, da …

3
Würde PCA für boolesche (binäre) Datentypen funktionieren?
Ich möchte die Dimensionalität von Systemen höherer Ordnung reduzieren und den größten Teil der Kovarianz auf einem vorzugsweise zweidimensionalen oder eindimensionalen Feld erfassen. Ich verstehe, dass dies über die Hauptkomponentenanalyse erfolgen kann, und ich habe PCA in vielen Szenarien verwendet. Ich habe es jedoch nie mit booleschen Datentypen verwendet und …


2
Wann ist t-SNE irreführend?
Zitat eines Autors: Das t-Distributed Stochastic Neighbor Embedding (t-SNE) ist eine ( preisgekrönte ) Technik zur Dimensionsreduktion, die sich besonders für die Visualisierung hochdimensionaler Datensätze eignet. Es klingt ziemlich gut, aber das ist der Autor. Ein weiteres Zitat des Autors (zum oben genannten Wettbewerb): Was haben Sie von diesem Wettbewerb …

3
Experimentelle Beweise für Visualisierungen im Tufte-Stil?
F: Gibt es experimentelle Beweise für minimalistische Visualisierungen im Tufte-Stil, die Daten sprechen, und nicht für Visualisierungen von beispielsweise Nigel Holmes ? Ich fragte, wie ich den R-Plots hier Chart-Junk hinzufügen könne , und die Responder warfen mir eine kräftige Menge Snark zu. Es muss also einige experimentelle Beweise geben, …

4
Wie interpretiere ich den Mittelwert der Silhouette?
Ich versuche, Silhouette Plot zu verwenden, um die Anzahl der Cluster in meinem Datensatz zu bestimmen. Angesichts des Datensatzes Train habe ich den folgenden Matlab-Code verwendet Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); Result = [ Result; num_of_cluster mean(s)]; end plot( …

3
Warum gibt es einen Unterschied zwischen der manuellen Berechnung eines Konfidenzintervalls für eine logistische Regression von 95% und der Verwendung der Funktion confint () in R?
Sehr geehrte Damen und Herren, mir ist etwas Merkwürdiges aufgefallen, das ich Ihnen nicht erklären kann. Zusammenfassend lässt sich sagen, dass der manuelle Ansatz zur Berechnung eines Konfidenzintervalls in einem logistischen Regressionsmodell und die R-Funktion confint()unterschiedliche Ergebnisse liefern. Ich habe die angewandte logistische Regression von Hosmer & Lemeshow (2. Auflage) …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 



2
Durchführen eines statistischen Tests nach der Datenvisualisierung - Datenbaggerung?
Ich werde diese Frage anhand eines Beispiels vorschlagen. Angenommen, ich habe einen Datensatz, z. B. den Preisdatensatz für Wohnimmobilien in Boston, in dem ich kontinuierliche und kategoriale Variablen habe. Hier haben wir eine "Qualitäts" -Variable von 1 bis 10 und den Verkaufspreis. Ich kann die Daten in Häuser mit "niedriger", …

5
Empfehlungen zu Farbe und Liniendicke für Liniendiagramme
Es wurde viel über farbenblinde Farbauswahlmöglichkeiten für Karten, Polygone und schattierte Bereiche im Allgemeinen geschrieben (siehe zum Beispiel http://colorbrewer2.org ). Ich konnte keine Empfehlungen für Linienfarben und unterschiedliche Liniendicken für Liniendiagramme finden. Ziele sind: leicht zu unterscheiden Linien, auch wenn sie sich verflechten Linien sind von Personen mit den häufigsten …

2
Wie zeichnet man die Entscheidungsgrenze eines k-Nächsten-Nachbarn-Klassifikators aus Elementen des statistischen Lernens?
Ich möchte die Handlung erzeugen, die im Buch ElemStatLearn "Die Elemente des statistischen Lernens: Data Mining, Inferenz und Vorhersage. Zweite Ausgabe" von Trevor Hastie & Robert Tibshirani & Jerome Friedman beschrieben ist. Die Handlung ist: Ich frage mich, wie ich dieses genaue Diagramm in erzeugen kann. RBeachten Sie insbesondere die …

3
Visualisierung einer Million, PCA-Edition
Ist es möglich, die Ergebnisse der Hauptkomponentenanalyse auf eine Weise darzustellen, die mehr Einsicht bietet als nur Übersichtstabellen? Ist es möglich, dies zu tun, wenn die Anzahl der Beobachtungen groß ist, sagen wir ~ 1e4? Und ist es möglich, es in R [andere Umgebungen willkommen] zu tun?

8
Open Source Tools zur Visualisierung mehrdimensionaler Daten?
Mit welchen Open-Source-Tools werden neben gnuplot und ggobi mehrdimensionale Daten visualisiert? Gnuplot ist mehr oder weniger ein einfaches Plot-Paket. Ggobi kann eine Reihe von raffinierten Dingen erledigen, wie zum Beispiel: Animieren Sie Daten entlang einer Dimension oder zwischen diskreten Sammlungen animieren Sie lineare Kombinationen, indem Sie die Koeffizienten variieren Hauptkomponenten …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.