Wie kann man bestimmen, welche Variable in einem Streudiagramm auf den X- und Y-Achsen liegt?


8

Ich versuche ein Streudiagramm zu erstellen, um die Beziehung zwischen Alphabetisierung und Kindersterblichkeit zu erkennen. Woher weiß ich, ob Alphabetisierung meine X-Achse und Kindersterblichkeit meine Y-Achse ist oder umgekehrt? Wie bestimme ich, was in der X-Achse und der Y-Achse verläuft?


Vorausgesetzt, Sie kennzeichnen die Achsen eindeutig, können Sie dies nach Belieben tun! (Aber es gibt ein paar Konventionen - und sie unterscheiden sich sogar zwischen verschiedenen Disziplinen.)
whuber

Offensichtlich genug, aber ein Detail, das für einige Bereiche von entscheidender Bedeutung ist: In verschiedenen Erd- und Umweltwissenschaften und auch in der Archäologie ist es üblich, die Tiefe unter oder die Höhe über der Land- oder Meeresoberfläche als vertikale Variable für Streuung und andere Parzellen zu verwenden. Dies scheint nur ein natürlicher Weg zu sein, um die Daten zu zeigen, wenn man bedenkt, wie die Daten unter Verwendung von atmosphärischen Ballons, Bohrungen, Kernen, Graben oder Ausgrabungen erzeugt werden.
Nick Cox

Antworten:


14

Wenn Sie eine Variable haben, die Sie als "erklärend" und die andere als zu erklärende Sache sehen, besteht eine (sehr häufige) Konvention darin, die erklärende Variable auf die x-Achse und die von ihr erklärte Sache auf die y-Achse zu setzen. Achse.

So können Sie beispielsweise die Beziehung zwischen Alphabetisierung und Sterblichkeit als potenziell ursächlich (und damit eindeutig erklärend) ansehen, da eine höhere Alphabetisierung zu einer geringeren Sterblichkeit führen kann.

In diesem Fall wäre es üblich, die Sterblichkeit auf die y-Achse und die Alphabetisierung auf die x-Achse zu legen.

Es ist aber auch möglich, sie anders herum zu verstehen (eine hohe Kindersterblichkeit kann sich durchaus auf die Alphabetisierungsrate auswirken) oder ohne die beiden zu erklären.

In einigen Fällen, wenn eine Variable 'fest' und die andere 'zufällig' ist, ist die üblichere Konvention, dass zufällig eine dazu neigt, auf die y-Achse des Diagramms zu gehen.

In einigen Bereichen können die Konventionen dazu neigen, umgedreht zu werden. das ist einfach am weitesten verbreitet.


4
Die Faustregeln, die ich den Schülern beibringe: Wenn eine Variable unter experimenteller Kontrolle stand (ein gutes Beispiel für Glen_bs "fest"), legen Sie sie auf die x-Achse. Wenn beide Variablen nur beobachtet werden, Sie jedoch eine zufällige Beziehung zwischen ihnen vermuten, setzen Sie "die Ursache" auf die x-Achse. Wenn Sie Vorhersagen für eine Variable basierend auf der anderen machen möchten, platzieren Sie die vorhergesagte auf der y-Achse und das, worauf Sie sie basieren, auf der x-Achse. Beschriften Sie die Achsen unabhängig davon, was Sie tun.
Silverfish

3
Und es gibt etwas, das ich selbst benutze, das ich aber noch nie richtig in den Griff bekommen habe, also habe ich es meinen Schülern nicht beigebracht. Wir haben oft zwei verwandte Variablen, zum Beispiel die Handspanne und die Körpergröße von Menschen, die beide von einer anderen Reihe von Variablen (Alter, Genetik, Ernährung) abhängen, anstatt dass eine direkt für die andere verantwortlich ist. Ich wette, wenn wir eine Strohumfrage durchführen würden, würde die Mehrheit der Analysten "Höhe" auf die x-Achse und "Handspan" auf die y-Achse setzen. In diesen Fällen scheint es üblich zu sein, die "grundlegendste" Variable auf die x-Achse zu setzen, aber es würde mir schwer fallen, eine feste Regel dafür zu definieren.
Silberfischchen

2
@ Beth, wenn diese Antworten Ihnen geholfen haben, können Sie sie verbessern, indem Sie auf die nach oben gerichtete Normalverteilung links von ihnen klicken. Wenn 1 oder beide Ihr Problem gelöst haben, können Sie es akzeptieren, indem Sie auf das Häkchen unter der Stimmenzahl klicken.
Gung - Reinstate Monica

+1 zur Verdeutlichung der Flexibilität.
Der Nate

1
@Silverfish Besser spät als nie, aber "lässig" ist ein Tippfehler für "kausal" in Ihrem ersten Kommentar. Ich werde eine Metakommentar hinzufügen, die ich diesen Tippfehler hunderte Male gesehen habe: Einige haben möglicherweise eine Art Autokorrektur verursacht, andere haben dazu geführt, dass der Autor zu beiläufig ist, um zu überprüfen, was er sagt. In Ihrem Fall beschuldige ich den ersteren.
Nick Cox

5

Jedes xy-Streudiagramm ist nur für den Endbenutzer relevant (so ziemlich das, was Whuber gesagt hat). Im Allgemeinen ist die x-Achse die Variable (Ursache) und die y-Achse die Antwort (Wirkung). In Ihrem Fall würde ich vorschlagen, dass Alphabetisierung eine Variable ist, die die Kindersterblichkeit beeinflusst, also würde ich Alphabetisierung auf das X und Mortalität auf das Y setzen.


3

Die unabhängige Variable befindet sich auf der x-Achse (das, was Sie ändern). Die abhängige Variable befindet sich auf der y-Achse (das, was Sie messen).


2
Willkommen auf der Website @ user99620. Können Sie das näher erläutern? Gegenwärtig ist es nach unseren Maßstäben eher ein Kommentar als eine Antwort, und ich bin mir nicht sicher, ob es etwas hinzufügt, wenn man bedenkt, was bereits in diesem Thread vorhanden ist.
Gung - Reinstate Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.