Ich habe Daten, für die ich die Spearman-Korrelation berechnet habe, und möchte sie für eine Veröffentlichung visualisieren. Die abhängige Variable wird eingestuft, die unabhängige Variable nicht. Was ich visualisieren möchte, ist eher der allgemeine Trend als die tatsächliche Steigung, daher habe ich die unabhängige Rangfolge eingestuft und die Spearman-Korrelation / Regression angewendet. Aber gerade als ich meine Daten plottete und sie in mein Manuskript einfügen wollte, stieß ich auf diese Aussage (auf dieser Website ):
Sie werden fast nie eine Regressionslinie für Beschreibung oder Vorhersage verwenden, wenn Sie eine Spearman-Rangkorrelation durchführen. Berechnen Sie also nicht das Äquivalent einer Regressionslinie .
und später
Sie können Spearman-Rangkorrelationsdaten wie bei einer linearen Regression oder Korrelation grafisch darstellen. Setzen Sie jedoch keine Regressionslinie in das Diagramm . Es wäre irreführend, eine lineare Regressionslinie in ein Diagramm einzufügen, wenn Sie es mit Rangkorrelation analysiert haben.
Die Sache ist, die Regressionslinien unterscheiden sich nicht so sehr von denen, bei denen ich die Unabhängigen nicht einordne und die Pearson-Korrelation berechne. Der Trend ist der gleiche, aber aufgrund der exorbitanten Gebühren für farbige Grafiken in Zeitschriften habe ich mich für die monochrome Darstellung entschieden und die tatsächlichen Datenpunkte überlappen sich so stark, dass sie nicht erkennbar sind.
Ich könnte mich natürlich darum herumarbeiten, indem ich zwei verschiedene Diagramme erstelle: eines für die Datenpunkte (Rang) und eines für die Regressionslinie (ohne Rang), aber wenn sich herausstellt, dass die von mir angegebene Quelle falsch ist oder das Problem In meinem Fall nicht so problematisch, würde es mir das Leben leichter machen. (Ich habe diese Frage auch gesehen , aber sie hat mir nicht geholfen.)
Bearbeiten für zusätzliche Informationen:
Die unabhängige Variable auf der x-Achse repräsentiert die Anzahl der Merkmale und die abhängige Variable auf der y-Achse repräsentiert den Rang, wenn Klassifizierungsalgorithmen in ihrer Leistung verglichen werden. Jetzt habe ich einige Algorithmen, die im Durchschnitt vergleichbar sind, aber was ich mit meinem Plot sagen möchte, ist etwa: "Während Klassifikator A besser wird, je mehr Merkmale vorhanden sind, ist Klassifizierer B besser, wenn weniger Merkmale vorhanden sind."
Bearbeiten Sie 2, um meine Diagramme einzuschließen:
Reihen von Algorithmen, die gegen die Anzahl der Merkmale aufgetragen sind
Reihen von Algorithmen, die gegen die eingestufte Anzahl von Merkmalen aufgetragen sind
Um die Frage aus dem Titel zu wiederholen:
Ist es in Ordnung, eine Regressionslinie für Rangdaten einer Spearman-Korrelation / Regression zu zeichnen?