In Bishops Mustererkennung und maschinellem Lernen las ich Folgendes, unmittelbar nachdem die Wahrscheinlichkeitsdichte eingeführt wurde:
Bei einer nichtlinearen Änderung der Variablen transformiert sich eine Wahrscheinlichkeitsdichte aufgrund des Jacobi-Faktors anders als eine einfache Funktion. Wenn wir zum Beispiel eine Änderung der Variablen , wird eine Funktion zu . Betrachten Sie nun eine Wahrscheinlichkeitsdichte , die einer Dichte in Bezug auf die neue Variable , wobei die die Tatsache bezeichnen, dass und unterschiedliche Dichten sind. Beobachtungen, die in den Bereich , werden für kleine Werte von in den Bereich transformiert ) wobei und damit .
Was ist der Jacobi-Faktor und was genau bedeutet alles (vielleicht qualitativ)? Bischof sagt, dass eine Konsequenz dieser Eigenschaft ist, dass das Konzept des Maximums einer Wahrscheinlichkeitsdichte von der Wahl der Variablen abhängt. Was bedeutet das?
Für mich kommt das alles aus heiterem Himmel (wenn man bedenkt, dass es im Einführungskapitel steht). Ich würde mich über einige Hinweise freuen, danke!