Es gibt zwei typische Situationen für diese Art von Problemen:
i) Sie möchten eine Stichprobe aus einer bestimmten Verteilung erstellen, deren Populationsmerkmale mit den angegebenen übereinstimmen (aufgrund von Stichprobenvariationen stimmen die Stichprobenmerkmale jedoch nicht genau überein).
ii) Sie möchten eine Stichprobe generieren, deren Stichprobenmerkmale mit den angegebenen übereinstimmen (aufgrund der Einschränkungen, dass die Stichprobenmengen genau auf einen vorgegebenen Satz von Werten abgestimmt sind, stammen Sie jedoch nicht wirklich aus der gewünschten Verteilung).
Sie möchten den zweiten Fall - aber Sie erhalten ihn, indem Sie denselben Ansatz wie im ersten Fall mit einem zusätzlichen Standardisierungsschritt verfolgen.
Für multivariate Normalen kann beides relativ einfach erfolgen:
Im ersten Fall könnten Sie zufällige Normalen ohne die Populationsstruktur verwenden (z. B. iid-Standardnormal mit der Erwartung 0 und der Identitätskovarianzmatrix) und diese dann auferlegen - transformieren, um die gewünschte Kovarianzmatrix und den gewünschten Mittelwert zu erhalten. Wenn und das Populationsmittel und die Kovarianz sind, die Sie benötigen, und normal ist, berechnen Sie für einige mit (z. B. könnte ein geeignetes durch Cholesky-Zerlegung erhalten werden). . Dann hat die gewünschten Populationsmerkmale.μΣzy=Lz+μLLL′=ΣLy
Bei der zweiten müssen Sie zuerst Ihre Zufallsnormalen transformieren, um auch die zufällige Abweichung vom Nullmittelwert und der Identitätskovarianz zu entfernen (wobei Stichprobenmittelwert und Stichprobenkovarianz ), und dann wie zuvor fortfahren. Dieser erste Schritt des Entfernens der Stichprobenabweichung vom exakten Mittelwert , Varianz stört jedoch die Verteilung. (In kleinen Proben kann es ziemlich schwerwiegend sein.)In0I
Dies kann durch Subtrahieren des Abtastmittelwerts von ( ) und Berechnen der Cholesky-Zerlegung von . Wenn der linke Cholesky-Faktor ist, sollte Stichprobenmittelwert 0 und die Kovarianz der Identitätsstichprobe haben. Sie können dann berechnen und eine Stichprobe mit den gewünschten Stichprobenmomenten erstellen. (Je nachdem, wie Ihre Stichprobenmengen definiert sind, kann es sein, dass es sich bei der Multiplikation / Division durch Faktoren wie um eine besonders kleine Fiedel handelt , aber es ist einfach genug, diesen Bedarf zu identifizieren.)zz∗=z−z¯z∗L∗z(0)=(L∗)−1z∗y=Lz(0)+μn−1n−−−√