Ausreißererkennung in Beta-Distributionen


8

Angenommen, ich habe eine große Stichprobe von Werten in [0,1] . Ich möchte die zugrunde liegende Beta(α,β) -Verteilung schätzen . Der Großteil der Proben stammt aus dieser angenommenen Beta(α,β) -Verteilung, während der Rest Ausreißer sind, die ich bei der Schätzung von α und ignorieren möchte β.

Was ist ein guter Weg, um dies zu tun?

Wäre der Standard: Inliers={x[Q11.5IQR,Q3+1.5IQR]} Formel in Boxplots verwendet eine schlechte Annäherung?

Was wäre ein prinzipiellerer Weg , dies zu lösen? Gibt es bestimmte Prioritäten für α und β , die bei dieser Art von Problem gut funktionieren würden?

                    Geben Sie hier die Bildbeschreibung ein


Sehen Sie die Antwort gepostet hier . Sobald die Ausreißer markiert wurden, entfernen Sie sie und verwenden Sie die MLE-Verteilungsanpassung für die verbleibenden Beobachtungen. Es wird aus den unter dem Link erläuterten Gründen genauer sein.
Benutzer603

Antworten:


1

αβ

ϕX1,...,XnϕU(0,1)+(1ϕ)Beta(α,β)

Lx(α,β,ϕ)=i=1n(ϕ+(1ϕ)Γ(α+β)Γ(α)Γ(β)xiα1(1xi)β1).

Sie können von hier aus entweder mit der klassischen MLE- oder der Bayes'schen Schätzung fortfahren. Beides erfordert numerische Techniken. Nachdem Sie die drei Parameter im Modell geschätzt haben, erhalten Sie eine Schätzung von und , die automatisch die Möglichkeit von Ausreißern berücksichtigt. Sie hätten auch eine Schätzung des Anteils der Ausreißer aus dem Mischungsmodell.αβ

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.