Sei die Verteilung, die auf den Zahlen , die jedem die Wahrscheinlichkeiten Per Definition sein (raw) Moment Grad istFx1<x2<…<xnpi>0xi.k
μk=∑i=1npixki.
Ich werde mit einer Reihe von Beobachtungen über diese Situation beginnen, von denen jede für sich von Interesse ist. Ein grundlegendes Werkzeug ist die Folge von Vektoren für Wenn Sie schreiben jeder Moment als Vektorprodukt ausgedrückt werdenxk=(xk1,xk2,…,xkn)k=0,1,…,n−1.p=(p1,p2,…,pn),
μk=∑i=1npixki=px′k.
Die Sammlung ist linear unabhängig. {x0,x1,…,xn−1} Um dies zu zeigen, nehmen Sie das Gegenteil an: Das heißt, die Koeffizienten nicht alle Null, so dass Komponente für Komponente ausgeschrieben, behauptet, dass für jedes Das zeigt jedes als Wurzel des PolynomsEin solches Polynom hat höchstens verschiedene Wurzeln, was der Unterscheidbarkeit von widersprichtck∑k=0n−1ckxk=0.(1)
(1)i=1,2,…,n, ∑k=0n−1ckxki=0.
xic(T)=cn−1Tn−1+cn−2Tn−2+⋯+c0.deg(c)≤n−1n xi.
Alle Momente werden durch die ersten Momentenμ0,μ1,…,μn−1. Das vorstehende Ergebnis zeigt, dass die Vektoren eine Basis für Daher für jedes eine lineare Kombination vondas heißt, es existieren Koeffizienten (bestimmt nur durch ), für die FolglichX={xk,k=0,1,…,n−1},Rn.m, xmxk, k=0,1,…,n−1;makxixm=ma0x0+ma1x1+⋯+man−1xn−1.
μm=px′m=p∑i=0n−1makx′k=∑i=0n−1makpx′k=∑i=0n−1makμk.
Die Zahlen und die ersten Momente bestimmenxinp. In der Tat sind die ersten Momente die Koeffizienten von in der Basis dual zunpX.
Die ersten Momente von bestimmen und werden durch die Verteilung bestimmt, die um eine Konstante verschoben istnFλ. Dies ist die Verteilung, die für mit den Wahrscheinlichkeiten Die Demonstration ist unkompliziert: Verwenden Sie den Binomialsatz, um in Bezug aufx1−λ,x2−λ,…,xn−λpi.(xi−λ)kx0i,x1i,…,xki.
Ein Teil der Frage ist, ob es einen positiven Wahrscheinlichkeitsvektor und Stützpunkte die eine Verteilung mit dem bestimmen gleiche Momente wie Angenommen, es gibt. Verschieben Sie beide Verteilungen um um die Situation auf Verteilungen mit nicht negativer Unterstützung zu vereinfachen . Wenn Sie beliebig groß nehmen, dominieren schließlich die größten Stützpunkte die Momente: Dies ist nur möglich, wenn undn′,q,y1<y2<…<yn′,GF.λ=−min(x1,y1),mqn′ymn′≈μm≈pnxmn
qn′=pnyn′=xn. Wenn wir induktiv fortfahren, schließen wir und das heißt,n=n′, q=p,x1=y1:G=F.
Wie viele Momente müssen schließlich bekannt sein, um und zu bestimmen ? Betrachten Sie die durch definierte ZuordnungSeine Ableitung ist die Matrixpxf:Rn×Rn≈R2n→R2nf(p′,x′)=(px′0,px′1,…,px′2n−1)′.
2n×2n
Df(p′,x′)=⎛⎝⎜⎜⎜⎜⎜⎜⎜1x1x21⋮x2n−11⋯⋯⋯⋯⋯1xnx2n⋮x2n−1n0p12p1x1⋮(2n−1)p1x2n−21⋯⋯⋯⋯⋯0pn2pnxn⋮(2n−1)pnx2n−2n⎞⎠⎟⎟⎟⎟⎟⎟⎟
mit einer Vandermonde-ähnlichen Struktur, die es uns ermöglicht, eine einfache Formel für ihre Determinante zu erhalten,
Det(Df(p′,x′))=−(p1p2⋯pn)2n(∏1≤i<j≤n(xi−xj))4.
Da keines der Null ist und alle sind, ist dies ungleich Null. Der Inverse-Funktionssatz impliziert, dass lokal invertierbar ist: Das heißt, wenn im Bereich von , existiert eine Inverse in einer Nachbarschaft von Das ist,pixifμ=(μ0,μ1,…,μ2n−1)ff−1⊂Rn×Rnμ.
Die ersten Momente bestimmen einen diskreten Satz von Lösungen , die diesen Momenten entsprechen.2nμ0,μ1,…,μ2n−1(p,x)
Wie wir bereits gezeigt haben, entsprechen alle diese Lösungen der gleichen Verteilung: Sie unterscheiden sich nur durch Permutieren der Indizes der Variablen.1,2,…,n