Wenn ich über das Einrichten Ihrer Daten lese, stoße ich oft darauf, dass das Umwandeln einiger kontinuierlicher Daten in kategoriale Daten keine gute Idee ist, da Sie möglicherweise die falsche Schlussfolgerung ziehen, wenn die Schwellenwerte schlecht bestimmt werden.
Derzeit liegen mir jedoch einige Daten vor (PSA-Werte für Prostatakrebspatienten), bei denen meines Erachtens der allgemeine Konsens lautet, dass Sie unter 4 wahrscheinlich keine haben, wenn Sie über 4 sind, einem Risiko ausgesetzt sind und dann so etwas wie über 10 und 20 haben Sie es wahrscheinlich. Sowas in der Art. Wäre es in diesem Fall immer noch falsch, meine fortlaufenden PSA-Werte in Gruppen von beispielsweise 0-4, 4-10 und> 10 zu kategorisieren? Oder ist es eigentlich okay, da die Schwellen sozusagen "gut bestimmt" sind?