Angenommen , ich habe eine Probe aus der gemeinsamen Verteilung von und . Wie teste ich die Hypothese , dass und sind unabhängig ?X Y X Y
Es wird keine Annahme über die Gelenk- oder Randverteilungsgesetze von und (am allerwenigsten die Gelenknormalität, da in diesem Fall die Unabhängigkeit mit der Korrelation identisch ist ).Y 0
Es wird keine Annahme über die Art einer möglichen Beziehung zwischen und ; Es kann nichtlinear sein, daher sind die Variablen nicht korreliert ( ), aber stark koabhängig ( ).Y r = 0 I = H
Ich sehe zwei Ansätze:
Bin beide Variablen und benutze Fischers genauen Test oder G-Test .
- Pro: Verwenden Sie gut etablierte statistische Tests
- Con: hängt vom Binning ab
Schätzen Sie die Abhängigkeit von und : (dies ist für unabhängiges und und wenn sie sich vollständig bestimmen).Y I ( X ; Y )XY1
- Pro: Erzeugt eine Zahl mit einer klaren theoretischen Bedeutung
- Con: hängt von der ungefähren Entropieberechnung ab (dh erneutes Binning)
Sind diese Ansätze sinnvoll?
Welche anderen Methoden wenden die Leute an?