Okay, also anstatt noch einmal Saunders Gleichung (5) abzuleiten, werde ich sie hier nur wiedergeben. Bedingung 1 und 2 implizieren folgende Gleichheit:
wobei
djk=P(Dj|Hk,I)
∏j=1m(∑k≠ihkdjk)=(∑k≠ihk)m−1(∑k≠ihk∏j=1mdjk)
djk=P(Dj|Hk,I)hk=P(Hk|I)
Nun können wir uns auf den Fall (zwei Datensätze) spezialisieren, indem wir D ( 1 ) 1 ≡ D 1 nehmen und D ( 1 ) 2 ≡ D 2 D 3 … D m neu bezeichnen . Beachten Sie, dass diese beiden Datensätze weiterhin die Bedingungen 1 und 2 erfüllen, sodass das obige Ergebnis auch für sie gilt. Wenn wir nun m = 2 ausdehnen, erhalten wir:m=2D(1)1≡D1D(1)2≡D2D3…Dmm=2
(∑k≠ihkd1k)(∑l≠ihld2l)=(∑k≠ihk)(∑l≠ihld1ld2l)
→∑k≠i∑l≠ihkhld1kd2l=∑k≠i∑l≠ihkhld1ld2l
→∑k≠i∑l≠ihkhld2l(d1k−d1l)=0(i=1,…,n)
Der Term kommt in der obigen Doppelsummation zweimal vor, einmal, wenn k = a und l = b , und noch einmal, wenn k = b und l = a . Dies geschieht so lange wie a , b ≠ i . Der Koeffizient jedes Terms ist durch d 2 b und - d 2 a gegeben . Da es nun i dieser Gleichungen gibt, können wir sie tatsächlich entfernen(d1a−d1b)k=al=bk=bl=aa,b≠id2b−d2ai aus diesen Gleichungen. Nehmenwirzur Veranschaulichung i = 1. Dies bedeutet, dass wir alle Bedingungen haben, mit Ausnahme von a = 1 , b = 2 und b = 1 , a = 2 . Nehmenwir nun i = 3 und wir können diese beiden Bedingungen haben (beachten Sie, dass dies mindestens drei Hypothesen voraussetzt). Die Gleichung kann also wie folgt umgeschrieben werden:ii=1a=1,b=2b=1,a=2i=3
∑l>khkhl(d2l−d2k)(d1k−d1l)=0
Jetzt muss jeder der -Terme größer als Null sein, da es sich sonst um eine n 1 < n- Hypothese handelt und die Antwort in n 1 umformuliert werden kann . So können diese aus dem obigen Satz von Bedingungen entfernt werden:hin1<nn1
∑l>k(d2l−d2k)(d1k−d1l)=0
Es gibt also Bedingungen, die erfüllt sein müssen, und jede Bedingung impliziert eine von zwei "Unterbedingungen": dassdjk=djlfür entwederj=1oderj=2(aber nicht notwendigerweise beide). Jetzt haben wir eine Menge aller eindeutigen Paare(k,l)fürdjk=djl. Wenn wirn-1dieser Paare für eines derj nehmenwürden, hätten wir alle Zahlen1,...n(n−1)2djk=djlj=1j=2(k,l)djk=djln−1j1,…,n in the set, and dj1=dj2=⋯=dj,n−1=dj,n. This is because the first pair has 2 elements, and each additional pair brings at least one additional element to the set*
But note that because there are n(n−1)2 conditions, we must choose at least the smallest integer greater than or equal to 12×n(n−1)2=n(n−1)4 for one of the j=1 or j=2. If n>4 then the number of terms chosen is greater than n−1. If n=4 or n=3 then we must choose exactly n−1 terms. This implies that dj1=dj2=⋯=dj,n−1=dj,n. Only with two hypothesis (n=2) is where this does not occur. But from the last equation in Saunder's article this equality condition implies:
P(Dj|H¯¯¯¯¯i)=∑k≠idjkhk∑k≠ihk=dji∑k≠ihk∑k≠ihk=dji=P(Dj|Hi)
Thus, in the likelihood ratio we have:
P(D(1)1|Hi)P(D(1)1|H¯¯¯¯¯i)=P(D1|Hi)P(D1|H¯¯¯¯¯i)=1 ORP(D(1)2|Hi)P(D(1)2|H¯¯¯¯¯i)=P(D2D3…,Dm|Hi)P(D2D3…,Dm|H¯¯¯¯¯i)=1
To complete the proof, note that if the second condition holds, the result is already proved, and only one ratio can be different from 1. If the first condition holds, then we can repeat the above analysis by relabeling D(2)1≡D2 and D(2)2≡D3…,Dm. Then we would have D1,D2 not contributing, or D2 being the only contributor. We would then have a third relabeling when D1D2 not contributing holds, and so on. Thus, only one data set can contribute to the likelihood ratio when condition 1 and condition 2 hold, and there are more than two hypothesis.
*NOTE: An additional pair might bring no new terms, but this would be offset by a pair which brought 2 new terms. e.g. take dj1=dj2 as first[+2], dj1=dj3 [+1] and dj2=dj3 [+0], but next term must have djk=djl for both k,l∉(1,2,3). This will add two terms [+2]. If n=4 then we don't need to choose any more, but for the "other" j we must choose the 3 pairs which are not (1,2),(2,3),(1,3). These are (1,4),(2,4),(3,4) and thus the equality holds, because all numbers (1,2,3,4) are in the set.