Ein Histogramm ist eine grafische Darstellung der Frequenzen einer stetigen Variablen. Die Variable ist in Bins unterteilt und für jeden Bin wird ein Balken gezeichnet, der proportional zu seiner Häufigkeit in den Daten ist.
Angenommen, ich möchte anhand eines Histogramms sehen, ob meine Daten exponentiell sind (dh nach rechts verschoben sind). Abhängig davon, wie ich die Daten gruppiere oder bin, kann es zu sehr unterschiedlichen Histogrammen kommen. Ein Satz von Histogrammen wird den Anschein erwecken, dass die Daten exponentiell sind. Ein anderer Satz wird …
Ich bin daran interessiert, eine möglichst optimale Methode zu finden, um zu bestimmen, wie viele Fächer ich in einem Histogramm verwenden soll. Meine Daten sollten höchstens 30 bis 350 Objekte umfassen. Insbesondere versuche ich, Schwellenwerte (wie Otsus Methode) anzuwenden, von denen "gute" Objekte, von denen ich weniger haben sollte und …
Ich habe dies aufgezeichnet, nachdem ich einen Shapiro-Wilk-Normalitätstest durchgeführt habe. Der Test hat gezeigt, dass es wahrscheinlich ist, dass die Bevölkerung normal verteilt ist. Wie kann man dieses "Verhalten" auf dieser Handlung sehen? AKTUALISIEREN Ein einfaches Histogramm der Daten: AKTUALISIEREN Der Shapiro-Wilk-Test sagt:
Wie beurteilen wir anhand von zwei Histogrammen, ob sie ähnlich sind oder nicht? Reicht es aus, nur die beiden Histogramme zu betrachten? Bei der einfachen Eins-zu-Eins-Zuordnung tritt das Problem auf, dass ein Histogramm, das sich geringfügig unterscheidet und geringfügig verschoben ist, nicht das gewünschte Ergebnis liefert. Irgendwelche Vorschläge?
Ich habe einen Vektor mit einer Poisson-Verteilung wie folgt generiert: x = rpois(1000,10) Wenn ich ein Histogramm mit mache hist(x), sieht die Verteilung wie eine bekannte glockenförmige Normalverteilung aus. Ein Kolmogorov-Smirnoff-Test zeigt jedoch, ks.test(x, 'pnorm',10,3)dass sich die Verteilung aufgrund des sehr geringen pWerts erheblich von einer Normalverteilung unterscheidet . Meine …
In diesem Kommentar schrieb Nick Cox: Klasseneinteilung ist eine alte Methode. Während Histogramme nützlich sein können, macht es eine moderne Statistiksoftware einfach und ratsam, Verteilungen an die Rohdaten anzupassen. Binning wirft nur Details weg, die entscheidend dafür sind, welche Verteilungen plausibel sind. Der Kontext dieses Kommentars schlägt die Verwendung von …
Wenn ich ein Histogramm meiner Daten zeichne, hat es zwei Peaks: Bedeutet das eine mögliche multimodale Verteilung? Ich habe das dip.testin R ( library(diptest)) ausgeführt und die Ausgabe ist: D = 0.0275, p-value = 0.7913 Kann ich daraus schließen, dass meine Daten eine multimodale Verteilung haben? DATEN 10346 13698 13894 …
Nach der Durchführung der Hauptkomponentenanalyse (PCA) möchte ich einen neuen Vektor auf den PCA-Raum projizieren (dh seine Koordinaten im PCA-Koordinatensystem finden). Ich habe PCA in R-Sprache mit berechnet prcomp. Jetzt sollte ich meinen Vektor mit der PCA-Rotationsmatrix multiplizieren können. Sollen die Hauptkomponenten in dieser Matrix in Zeilen oder Spalten angeordnet …
Ich habe zwei Datensätze, die Sternparameter darstellen: einen beobachteten und einen modellierten. Mit diesen Sets erstelle ich ein sogenanntes Zwei-Farben-Diagramm (TCD). Ein Beispiel ist hier zu sehen: A sind die beobachteten Daten und B die aus dem Modell extrahierten Daten (egal, welche schwarzen Linien, welche Punkte die Daten darstellen). Ich …
Ich möchte zwei Bilder von Gesichtern vergleichen. Ich habe ihre LBP-Histogramme berechnet. Jetzt muss ich diese beiden Histogramme vergleichen und etwas herausfinden, das angibt, wie sehr diese Histogramme gleich sind (0 - 100%). Es gibt viele Möglichkeiten, diese Aufgabe zu lösen, aber die Autoren der LBP-Methode betonen (Gesichtsbeschreibung mit lokalen …
Wenn wir die Verteilung kontinuierlicher Daten sichtbar sehen wollen, welches zwischen Histogramm und PDF sollte verwendet werden? Was sind die formelmäßigen Unterschiede zwischen Histogramm und PDF?
Nach einer kürzlichen Abstimmung habe ich versucht, mein Verständnis des Pearson Chi Squared-Tests zu überprüfen. Normalerweise verwende ich die Chi-Quadrat-Statistik (oder die reduzierte Chi-Quadrat-Statistik) zum Anpassen oder Überprüfen der resultierenden Passform. In diesem Fall entspricht die Varianz normalerweise nicht der erwarteten Anzahl von Zählungen in einer Tabelle oder einem Histogramm, …
Ich habe ein Problem mit der Normalität einiger meiner Daten: Ich habe einen Kolmogorov-Test durchgeführt, der besagt, dass es mit p = .0000 nicht normal ist. Ich verstehe nicht: Die Schiefe meiner Verteilung = -. 497 und die Kurtosis = -0.024 Hier ist die Handlung meiner Distribution, die sehr normal …
Nehmen wir an, ich habe zwei Verteilungen, die ich im Detail vergleichen möchte, dh auf eine Weise, die Form, Skalierung und Verschiebung leicht sichtbar macht. Eine gute Möglichkeit, dies zu tun, besteht darin, für jede Verteilung ein Histogramm zu zeichnen, sie auf die gleiche X-Skala zu setzen und untereinander zu …
Es scheint eine Menge Verwirrung im Vergleich zwischen der Verwendung von glmnetinside caretzur Suche nach einem optimalen Lambda und der Verwendung cv.glmnetderselben Aufgabe zu geben. Viele Fragen wurden gestellt, zB: Klassifizierungsmodell train.glmnet vs. cv.glmnet? Was ist der richtige Weg, um glmnet mit caret zu verwenden? Quervalidierung von "glmnet" mit "caret" …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.