Was können wir ab einer Stichprobengröße von 1 zum Populationsmittelwert sagen?


43

Ich frage mich , was wir sagen können, wenn überhaupt, über die Bevölkerung bedeuten, , wenn alles , was ich habe eine Messung ist, (Probengröße von 1). Natürlich hätten wir gerne mehr Messungen, aber wir können sie nicht bekommen.y 1μy1

Mir scheint, da der Stichprobenmittelwert trivial gleich , ist . Bei einer Stichprobengröße von 1 ist die Stichprobenvarianz jedoch undefiniert, und daher ist unser Vertrauen in die Verwendung von als Schätzer von ebenfalls undefiniert. Würde es eine Möglichkeit geben, unsere Schätzung von überhaupt ? y1E[ ˉ y ]=E[y1]=μ ˉ y μμy¯y1E[y¯]=E[y1]=μy¯μμ


Ja, ein Konfidenzintervall für kann unter bestimmten Voraussetzungen erstellt werden. Wenn es niemand veröffentlicht, werde ich es aufspüren. μ
Soakley

5
Unter stats.stackexchange.com/questions/1807 finden Sie eine andere Version derselben Frage (der Durchschnitt einer Stichprobe ist verfügbar, aber nicht die Stichprobengröße, sodass der Durchschnitt effektiv eine einzelne Beobachtung aus der unbekannten Stichprobenverteilung ist) und stats.stackexchange .com / questions / 20300 für eine ähnliche Diskussion.
Whuber

Ein kürzlich erschienener Artikel über die Optimalität dieser Schätzer im Normalfall: tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305

Antworten:


8

Hier ist ein brandneuer Artikel zu dieser Frage für den Fall Poisson, der einen schönen pädagogischen Ansatz verfolgt:

Andersson. Per Gösta (2015). Ein Klassenzimmer-Ansatz zur Konstruktion eines ungefähren Konfidenzintervalls eines Poisson-Mittels unter Verwendung einer Beobachtung. The American Statistician , 69 (3), 160-164, DOI: 10.1080 / 00031305.2015.1056830 .


... leider hinter einer Paywall.
Tim

@ Tim: das ist so. Andererseits ist eine ASA-Mitgliedschaft nicht sonderlich teuer, und Sie erhalten Zugang zu The American Statistician , JASA und einigen anderen Zeitschriften zu einem sehr vernünftigen Preis, den ich persönlich sehr gerne aus eigener Tasche bezahle. Ich glaube wirklich, dass Sie hier auf Ihre Kosten kommen. YMMV natürlich.
S. Kolassa - Wiedereinsetzung von Monica

4
+1, aber der Poisson-Fall unterscheidet sich radikal vom Normalfall, weil die Varianz gleich dem Mittelwert sein muss. Das Poisson-Ergebnis ist ziemlich einfach, während dasErgebnis für den Normalfall ist kontraintuitiv und rätselhaft. x±9.68|x|
Amöbe sagt Reinstate Monica

@amoeba: ganz richtig, aber das OP hat keine Einschränkungen für die Verteilung angegeben.
S. Kolassa - Wiedereinsetzung von Monica

Dies ist so kurz, dass es besser als Kommentar dienen würde. Da es sich jedoch um die akzeptierte Antwort handelt, möchten Sie sie wahrscheinlich nicht in einen Kommentar umwandeln. Könnten Sie dann vielleicht die Hauptpunkte des Artikels zusammenfassen?
Richard Hardy

42

Wenn bekannt ist, dass die Grundgesamtheit normal ist, ergibt sich für ein Konfidenzintervall von 95% basierend auf einer einzelnen Beobachtungx ± 9,68 | x |x

x±9.68|x|

Dies wird in dem Artikel "Ein effektives Konfidenzintervall für den Mittelwert mit Proben der Größe Eins und Zwei" von Wall, Boen und Tweedie, The American Statistician , Mai 2001, Vol. 4, No. 55, Nr . 2 . ( pdf )


5
Ich mag es nicht, dumm zu klingen, aber ... sicherlich nicht. Dies hängt von den Einheiten ab und verhält sich überhaupt nicht richtig (mit richtig meine ich Skalarmultiplikation ...)
Alec Teal

8
@Alec Nur weil eine Prozedur von Maßeinheiten abhängt (dh nicht invariant ist), heißt das nicht, dass sie automatisch ungültig oder sogar schlecht ist. Dieser ist gültig: Lies den Artikel und rechne nach. Viele werden jedoch zugeben, dass es ein wenig störend ist. Noch überraschender ist, dass Sie nicht einmal davon ausgehen müssen, dass die zugrunde liegende Verteilung normal ist: Ein ähnliches Ergebnis gilt für jede unimodale Verteilung (aber 9,68 muss auf ungefähr 19 erhöht werden): siehe die Links, die ich in einem Kommentar dazu bereitgestellt habe Frage.
whuber

4
Eine spätere Ausgabe des Journals hatte drei Briefe an den Herausgeber, von denen einer Alec Teal auf die Einheiten aufmerksam machte. In der Antwort von Wall heißt es: "Das Konfidenzintervall ist nicht äquivariant (dh seine Überdeckungswahrscheinlichkeit hängt vom Verhältnis von ...)" Später sagt: "Das Konfidenzintervall basiert nicht auf einer entscheidenden Größe ..." Es ist zweifellos ein ungewöhnlicher Ansatz und ein ungewöhnliches Ergebnis! |μ|σ
Soakley


3
Dies scheint Konfidenzintervalle zu ergeben, die den Mittelwert mit einer Wahrscheinlichkeit von etwa abdecken, wenn aber mit viel höheren Wahrscheinlichkeiten. Wenn ist, ist die Wahrscheinlichkeit eindeutig da die Konfidenzintervalle immer enthalten . σ | μ | > 0 μ = 0 100 % 095%σ|μ|>0μ=0100%0
Henry

28

Sicher gibt es. Verwenden Sie ein Bayes'sches Paradigma. Möglicherweise haben Sie zumindest eine Vorstellung davon, wie hoch Ihre könnte - zum Beispiel, dass es physisch nicht negativ sein kann oder dass es offensichtlich nicht größer als 100 sein kann (vielleicht messen Sie die Größe Ihrer örtlichen Highschool-Fußballmannschaft in Fuß). Setzen Sie einen Prior darauf, aktualisieren Sie ihn mit Ihrer einsamen Beobachtung, und Sie haben einen wunderbaren Seitenzahn.μ


18
(+1) Eine Beobachtung wird vom Prior überwältigt sein, so dass es den Anschein hat, als ob das, was Sie aus dem Seitenzahn herausholen, nicht viel mehr ist als das, was Sie in den Prior setzen.
Whuber

Was wäre, wenn wir einen solchen Prior mit der Wahrscheinlichkeit kombinieren würden, die dieses elende impliziert? x±9.68|x|
Simon Kuang

@SimonKuang: Ein konzeptionelles Problem ist, dass wir nurIntervall nach wir beobachtet haben , so kann dies die nicht betreten vor . Xx±9.68|x|x
S. Kolassa - Wiedereinsetzung von Monica am

@StephanKolassa Nein, dieses Intervall (und die damit verbundene Verteilung) bildet die Wahrscheinlichkeit. Unser Prior ist getrennt.
Simon Kuang

@ SimonKuang: Ja, du hast recht, mein Fehler. Leider habe ich zum jetzigen Zeitpunkt nicht die Zeit, dies durchzugehen, aber wenn Sie dies tun, posten Sie bitte, was Sie finden!
S. Kolassa - Wiedereinsetzung von Monica am

14

Eine kleine Simulationsübung, um zu veranschaulichen, ob die Antwort von @soakley funktioniert:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

Von einer Million zufälliger Versuche enthält das Konfidenzintervall den wahren Mittelwert eine Million Mal, das heißt immer . Dies sollte nicht der Fall sein, wenn das Konfidenzintervall 95% beträgt.

Die Formel scheint also nicht zu funktionieren ... Oder habe ich einen Codierungsfehler gemacht?

(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
μμ=0

2
α1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)

2
μμμsim(0.1)μ

2
P(Xζ|X|μX+ζ|X|)1αμ

2
μμ=0

0

Siehe Edelman, D (1990) "Ein Konfidenzintervall für das Zentrum einer unbekannten unimodalen Verteilung basierend auf einer Stichprobengröße 1".


3
Willkommen bei Stats.SE. Können Sie bitte Ihre Antwort bearbeiten, um sie zu erweitern und die Hauptpunkte des von Ihnen zitierten Buches aufzunehmen? Dies ist sowohl für das Originalplakat als auch für andere Personen hilfreich, die auf dieser Site suchen. Übrigens, nutzen Sie die Gelegenheit, um an der Tour teilzunehmen , falls Sie dies noch nicht getan haben. Siehe auch einige Tipps zur Beantwortung , zur Formatierungshilfe und zum Aufschreiben von Gleichungen mit LaTeX / MathJax .
Ertxiem

Willkommen auf unserer Seite, David. Ihr Beitrag als Autor dieses Artikels (von dem ich glaube, dass er in mehreren Threads zitiert wurde) wird sehr geschätzt. Daher sind alle Perspektiven und Kommentare, die Sie in dieser Antwort abgeben können, sehr willkommen.
Whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.