Es gibt eine Variable in meinen Daten, bei der 80% der Daten fehlen. Die Daten fehlen wegen Nichtvorhandenseins (dh wie viel Bankdarlehen das Unternehmen schuldet). Ich bin auf einen Artikel gestoßen, in dem es heißt, dass die Dummy-Variable-Einstellmethode die Lösung für dieses Problem ist. Bedeutet das, dass ich diese stetige Variable in eine kategoriale Variable umwandeln muss?
Ist das die einzige Lösung? Ich möchte diese Variable nicht löschen, da ich sie theoretisch für wichtig für meine Forschungsfrage halte.
Vielen Dank.