Ich verstehe jetzt, dass dies von Verteilungen und Normalität in Prädiktoren abhängt
Durch die Protokolltransformation werden die Daten einheitlicher
Im Allgemeinen ist dies falsch - aber selbst wenn dies der Fall wäre, warum sollte Einheitlichkeit wichtig sein?
Betrachten Sie zum Beispiel
i) Ein binärer Prädiktor, der nur die Werte 1 und 2 annimmt. Wenn Protokolle verwendet werden, bleibt er als binärer Prädiktor übrig, der nur die Werte 0 und log 2 annimmt. Er beeinflusst nichts wirklich außer dem Abfangen und Skalieren von Begriffen, die diesen Prädiktor betreffen. Sogar der p-Wert des Prädiktors würde unverändert bleiben, ebenso wie die angepassten Werte.
ii) Betrachten Sie einen Prädiktor für den linken Versatz. Nehmen Sie jetzt Protokolle. Es wird in der Regel mehr links schief.
iii) einheitliche Daten werden nach links verschoben
(Es ist jedoch oft nicht immer eine so extreme Veränderung)
weniger von Ausreißern betroffen
Im Allgemeinen ist dies falsch. Betrachten Sie niedrige Ausreißer in einem Prädiktor.
Ich dachte darüber nach, alle meine kontinuierlichen Variablen, die nicht von Hauptinteresse sind, in ein Protokoll umzuwandeln
Zu welchem Ende? Wenn die Beziehungen ursprünglich linear wären, wären sie nicht länger.
Und wenn sie bereits gekrümmt wären, könnte dies automatisch dazu führen, dass sie schlechter (gebogener) und nicht besser werden.
- -
Das Erstellen von Protokollen eines Prädiktors (ob von primärem Interesse oder nicht) mag manchmal geeignet sein, ist aber nicht immer so.