whuber hat dir in den Kommentaren gesagt, dass das Codieren einer 0-3- oder 1-4-Codierung anstelle des Erstellens von Dummy-Variablen nicht das ist, was du willst. Dies ist ein Versuch - ich soll hoffentlich erklären, was Sie mit diesem Modell machen würden und warum es falsch ist.
Wenn Sie eine Variable X so codieren, dass wenn A dann X = 1, wenn B dann X = 2, wenn C dann X = 3, wenn D dann X = 4, wenn Sie die Regression durchführen, Sie nur einen Parameter erhalten. Angenommen, der mit X verknüpfte geschätzte Parameter war 2. Dies würde Ihnen sagen, dass die erwartete Differenz zwischen dem Mittelwert von B und dem Mittelwert von A 2 beträgt. Es zeigt Ihnen auch, dass die erwartete Differenz zwischen dem Mittelwert von C ist und der Mittelwert von B ist 2. Einige für D und C. Sie würden die Unterschiede in den Mitteln für diese Gruppen zwingen, diesem sehr strengen Muster zu folgen. Dieser eine Parameter sagt Ihnen genau, wie sich alle Mittelwerte Ihrer Gruppe aufeinander beziehen.
Wenn Sie also diese Art der Codierung durchführen, müssen Sie davon ausgehen, dass Sie nicht nur die richtige Reihenfolge erhalten haben (denn in diesem Fall müssen Sie, wenn Sie eine Erhöhung von A nach B erwarten, eine Erhöhung von B nach C und von C erwarten zu D) aber Sie müssen auch davon ausgehen, dass dieser Unterschied der gleiche ist!
Wenn Sie stattdessen die vorgeschlagene Dummy-Codierung durchführen, lassen Sie zu, dass jede Gruppe ihren eigenen Mittelwert hat - ohne Einschränkungen. Dieses Modell ist viel sinnvoller und beantwortet die gewünschten Fragen.