Da ( wie allgemein bekannt ) eine gleichmäßige Verteilung auf der Einheitskugel durch Normalisieren einer Variantennormalverteilung erhalten wird und das Punktprodukt der normalisierten Vektoren ihr Korrelationskoeffizient ist, sind die Antworten auf die drei Fragen sind: DSD−1Dt
( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2 hat eine Beta -Verteilung.((D−1)/2,(D−1)/2)
Die Varianz von ist (wie in der Frage spekuliert).1 / Dt1/D
Die standardisierte Verteilung von nähert sich der Normalität mit einer Rate vonO ( 1tO(1D).
Methode
Die genaue Verteilung des Punktprodukts von Einheitsvektoren ist geometrisch leicht zu erhalten, da dies die Komponente des zweiten Vektors in Richtung des ersten ist. Da der zweite Vektor unabhängig vom ersten ist und gleichmäßig auf der Einheitskugel verteilt ist, ist seine Komponente in der ersten Richtung genauso verteilt wie jede Koordinate der Kugel. (Beachten Sie, dass die Verteilung des ersten Vektors keine Rolle spielt.)
Die Dichte finden
Wenn diese Koordinate die letzte ist, ist die Dichte bei daher proportional zur Oberfläche, die in einer Höhe zwischen und auf der Einheitskugel liegt. Dieser Anteil tritt innerhalb eines Riemens mit der Höhe und dem Radius der im Wesentlichen ein Kegelstumpf ist , der aus einem mit dem Radius der Höhe und Steigung . Woher ist die Wahrscheinlichkeit proportional zut t + d t d t √t∈[−1,1]tt+dtdtS D - 2 √1−t2−−−−−√,SD−2dt1/ √1−t2−−−−−√,dt1/1−t2−−−−−√
(1−t2−−−−−√)D−21−t2−−−−−√dt=(1−t2)(D−3)/2dt.
Wenn ist, ist . Wenn man das in das Vorhergehende einfügt, ergibt sich für das Wahrscheinlichkeitselement eine normalisierende Konstante:T = 2 u - 1u=(t+1)/2∈[0,1]t=2u−1
fD(u)du∝(1−(2u−1)2)(D−3)/2d(2u−1)=2D−2(u−u2)(D−3)/2du.
Es ist unmittelbar, dass eine Beta -Verteilung hat, weil (per Definition) auch seine Dichte proportional zu ist( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2((D−1)/2,(D−1)/2)
u(D−1)/2−1(1−u)(D−1)/2−1=(u−u2)(D−3)/2∝fD(u).
Festlegen des Begrenzungsverhaltens
Daraus ergeben sich mit elementaren Techniken leicht Informationen über das Begrenzungsverhalten: kann integriert werden, um die Proportionalitätskonstante ; kann integriert werden (z. B. unter Verwendung von Eigenschaften von Beta-Funktionen), um Momente zu erhalten, die zeigen, dass die Varianz und auf schrumpft (ausgehend von Chebyshevs Theorem wird die Wahrscheinlichkeit in der Nähe von konzentriert) ); und die Grenzverteilung wird dann gefunden, indem Werte der Dichte der standardisierten Verteilung, proportional zu für kleine Werte von berücksichtigt werdenΓ ( nfDtkfD(t)1/D0t=0fD(t/√Γ(n2)π√Γ(D−12)tkfD(t)1/D0t=0tfD(t/D−−√),t :
log(fD(t/D−−√))=C(D)+D−32log(1−t2D)=C(D)−(1/2+32D)t2+O(t4D)→C−12t2
wobei die 's (log) Integrationskonstanten darstellen. Offensichtlich ist die Rate, mit der sich dies der Normalität nähert (für die die logarithmische Dichte gleich ),- 1CO(1−12t2O(1D).
Dieses Diagramm zeigt die Dichten des Punktprodukts für , wie auf Einheitsvarianz standardisiert, und ihre Grenzdichte. Die Werte bei erhöhen sich mit (von blau über rot, gold und dann grün für die normale Standarddichte). Die Dichte für wäre bei dieser Auflösung nicht von der normalen Dichte zu unterscheiden.0 D D = 1000D=4,6,100DD=1000