Angenommen, wir haben . Was bedeutet die Stichprobenverteilung der Stichprobe?
Mit anderen Worten, welcher Verteilung folgt die Stichprobe einer Beta?
Angenommen, wir haben . Was bedeutet die Stichprobenverteilung der Stichprobe?
Mit anderen Worten, welcher Verteilung folgt die Stichprobe einer Beta?
Antworten:
Hinweis: Siehe auch für dieselbe Frage /math/85535/sum-of-niid-beta-distributed-variables
Für den Fall einer gleichmäßigen Verteilung Die Verteilung der Summe mehrerer unabhängiger Variablen (und der Mittelwert hängt damit zusammen) wurde als Irwin-Hall- Verteilung beschrieben.
Wenn
dann hast du einen Spline of Degree
bei dem die kann durch eine Wiederholungsbeziehung beschrieben werden:
Sie könnten die obige Formel als durch eine wiederholte Faltung von konstruiert sehen mit wo das Integral stückweise gelöst wird. Können wir dies möglicherweise für verteilte Beta-Variablen mit irgendwelchen verallgemeinern? und ?
Lassen
Wir erwarten die Funktion aufgeteilt werden in Stücke (obwohl möglicherweise kein Spline mehr). Die Faltung zur Berechnung der Verteilung von wird so etwas sein wie:
Zum ::
Für Ganzzahl und : die Begriffe wie und kann für ganzzahlige Werte von erweitert werden und , so dass das Integral einfach zu lösen ist.
Zum Beispiel:
Die Lösung für ganzzahlige Werte von und wird auch ein Spline sein. Möglicherweise könnte dies in eine nette (oder wahrscheinlich nicht so schöne) Formel für allgemeinere Situationen (nicht nur) umgewandelt werden und or ). Aber an diesem Punkt braucht man einige Tassen Kaffee oder besser eine Infusion, um dieses Zeug anzugehen.
Ich dachte, dies sei eine interessante Frage, daher hier eine kurze visuelle Untersuchung. ZumIch habe zuerst 4 separate Beta-Distributionen ausgewählt (PDFs siehe unten).
Dann habe ich Probenmittel gesammelt, und zeichnete die entsprechenden Histogramme wie unten gezeigt. Die Ergebnisse sehen normal aus und ich neige dazu, @ ChristophHancks Behauptung zu glauben, dass hier der zentrale Grenzwertsatz (CLT) am Werk ist.
MATLAB-Code
% Parameters
n = 5000;
K = 5000;
% Define Beta distributions
pd1 = makedist('Beta',0.25,0.45);
pd2 = makedist('Beta',0.25,2.5);
pd3 = makedist('Beta',4,0.15);
pd4 = makedist('Beta',3.5,5);
% Collect Sample Means
X1bar = zeros(K,1);
X2bar = zeros(K,1);
X3bar = zeros(K,1);
X4bar = zeros(K,1);
for k = 1:K % get K sample means
X1bar(k) = mean(random(pd1,n,1)); % take mean of n samples
X2bar(k) = mean(random(pd2,n,1));
X3bar(k) = mean(random(pd3,n,1));
X4bar(k) = mean(random(pd4,n,1));
end
% Plot Beta distribution PDFs
Xsupport = 0:.01:1;
figure, hold on, box on
title('Beta(\alpha_1,\alpha_2) PDFs')
plot(Xsupport,pdf(pd1,Xsupport),'r-','LineWidth',2.2)
plot(Xsupport,pdf(pd2,Xsupport),'b-','LineWidth',2.2)
plot(Xsupport,pdf(pd3,Xsupport),'k-','LineWidth',2.2)
plot(Xsupport,pdf(pd4,Xsupport),'g-','LineWidth',2.2)
legend('(0.25,0.45)','(0.25,2.5)','(4,0.15)','(3.5,5)')
figure
s(1) = subplot(2,2,1), hold on, box on
histogram(X1bar,'FaceColor','r')
s(2) = subplot(2,2,2), hold on, box on
histogram(X2bar,'FaceColor','b')
s(3) = subplot(2,2,3), hold on, box on
histogram(X3bar,'FaceColor','k')
s(4) = subplot(2,2,4), hold on, box on
histogram(X4bar,'FaceColor','g')
title(s(1),'(0.25,0.45)')
title(s(2),'(0.25,2.5)')
title(s(3),'(4,0.15)')
title(s(4),'(3.5,5)')
Bearbeiten: Dieser Beitrag war ein schneller Versuch, dem OP etwas zu bieten. Wie bereits erwähnt, impliziert der zentrale Grenzwertsatz (CLT) , dass diese Ergebnisse für jede Verteilung mit endlicher Varianz gelten.