Diese Typologien können leicht so viel verwirren, wie sie erklären.
Zum Beispiel Binärdaten, wie in vielen Einführungstexten oder Kursen eingeführt, klingt sicherlich qualitativ: ja oder nein, überlebt oder gestorben, anwesend oder abwesend, männlich oder weiblich, was auch immer. Aber bewerten Sie die beiden Möglichkeiten 1 oder 0 und alles ist dann perfekt quantitativ. Eine solche Bewertung ist die Grundlage aller Arten von Analysen: Der Anteil der Frauen ist nur der Durchschnitt von mehreren Nullen für Männer und Einsen für Frauen. Wenn ich auf 7 Frauen und 3 Männer treffe, kann ich nur 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 mitteln, um den Anteil 0,7 zu erhalten. Mit binären Antworten haben Sie dann einen weiten Weg frei, um die Regression zu protokollieren und zu testen usw., die sich auf die Variation des Anteils, des Bruchteils oder der Wahrscheinlichkeit, die überlebt hat, oder auf etwas Ähnliches konzentrieren, mit was auch immer es sonst kontrolliert oder beeinflusst. Niemand muss sich Sorgen machen, dass die Codierung willkürlich ist. Der Anteil männlich ist nur 1 minus dem Anteil weiblich,
Fast das Gleiche gilt, wenn nominale oder ordinale Daten berücksichtigt werden, da jede Analyse solcher Daten davon abhängt , wie viele in jede Kategorie fallen und Sie dann so quantitativ sein können, wie Sie möchten. Kreisdiagramme und Balkendiagramme, wie sie zum ersten Mal in frühen Jahren angetroffen wurden, zeigen dies. Es ist daher rätselhaft, wie viele Konten dies in Erklärungen übersehen.
Anders ausgedrückt, Sie können Roh- oder Originaldaten so klassifizieren, wie sie zuerst gemeldet wurden und beispielsweise in der Zelle einer Tabelle oder Datenbank angezeigt werden. Aber seine ursprüngliche Form ist nicht unveränderlich. Stellen Sie sich etwas Starkes vor, wie einen Tod durch Verwirrung, wenn Sie zu viele oberflächliche Lehrbücher lesen. Das kann auf ein Zertifikat geschrieben werden, aber die statistische Analyse hört hier nie auf. Es gibt eine Aggregation von Zählungen (wie viele solcher Todesfälle in einem Gebiet und einem Zeitraum), eine Reduzierung der Raten (wie viele im Verhältnis zur gefährdeten Bevölkerung) und so weiter.
Daher verhindert die Art und Weise, wie die Daten zuerst codiert werden, selten ihre Verwendung auf andere Weise und die Umwandlung in andere Formen. Die Etymologie der Daten ist hier aufschlussreich: Wenn Sie das ursprüngliche Latein wörtlich übersetzen, sind sie so, wie sie Ihnen gegeben wurden, aber es gibt keine Regel gegen die Konvertierung in viele andere Formen.