Den Beweis eines Lemmas verstehen, das in der Hoeffding-Ungleichung verwendet wird


11

Ich studiere Larry Wassermans Vorlesungsunterlagen zur Statistik, in denen Casella und Berger als Haupttext verwendet werden. Ich arbeite seine Vorlesungsunterlagen Satz 2 durch und stecke in der Ableitung des Lemmas fest, das in Hoeffdings Ungleichung verwendet wird (S. 2-3). Ich reproduziere den Beweis in den Anmerkungen unten und nach dem Beweis werde ich darauf hinweisen, wo ich festsitze.


Lemma

Angenommen, E(X)=0 und aXb . Dann E(etX)et2(ba)2/8 .

Beweis

Da , können wir X als konvexe Kombination von a und b schreiben , nämlich X = α b + ( 1 - α ) a, wobei α = X - aaXbXabX=αb+(1α)a . Durch die Konvexität der Funktionyety habenwirα=Xabayety

etXαetb+(1α)eta=Xabaetb+bXbaeta

Nehmen Sie die Erwartungen beider Seiten und verwenden Sie die Tatsache , um zu erhaltenE(X)=0

E(etX)abaetb+bbaeta=eg(u)

wobei , g ( u ) = - γ u + log ( 1 - γ + γ e u ) und γ = - a / ( b - a ) . Man beachte, dass g ( 0 ) = g istu=t(ba)g(u)=γu+log(1γ+γeu)γ=a/(ba). Auchgg(0)=g(0)=0für allu>0.g(u)1/4u>0

Durch Taylor-Theorem gibt es ein , so dass g ( u ) = g ( 0 ) + u gε(0,u)g(u)=g(0)+ug(0)+u22g(ε)=u22g(ε)u28=t2(ba)28

Daher ist .E(etX)eg(u)et2(ba)28


Ich konnte dem Beweis folgen bis

aber ich kann nicht herausfinden, wie manu,g(u),γ ableitet.E(etX)abaetb+bbaeta=eg(u)u,g(u),γ


3
Es ist interessant , dass der maximale Wert von ist , σ 2 max = ( b - a ) 2 / 4 und somit das Ergebnis effektiv E [ e t X ] e σ 2 max t 2 / 2 , die viel zu aussieht vertraut, um aus reinem Zufall zu entstehen. Ich vermute, dass es einen anderen, möglicherweise einfacheren Weg gibt, das Ergebnis über ein probabilistisches Argument abzuleiten. var(X)σmax2=(ba)2/4
E[etX]eσmax2t2/2
Dilip Sarwate

@ DilipSarwate Mein Verständnis ist, dass die maximale Varianz für eine einheitliche Zufallsvariable auftritt . Die Varianz von X ist V a r ( X ) = ( b - a ) 2XU(a,b)X . Können Sie bitte erklären, wie Sie zu(b-a)2 gekommen sind?Var(X)=(ba)212 ? (ba)24
Anand

Durch die Konzentration der Masse auf die Endpunkte ...
Elvis

@ DilipSarwate Ich habe dem Beweis einige Kommentare hinzugefügt, die ein wenig klarstellen können, warum der schlimmste Fall die maximale Varianz ist.
Elvis

1
@DilipSarwate - Siehe Lemma 1 und Übung 1 hier: terrytao.wordpress.com/2010/01/03/… . Es scheint, dass es eine einfachere Ableitung gibt, die auf Jensens Ungleichung und Taylors Expansion beruht. Die Einzelheiten hierzu sind mir jedoch unklar. Vielleicht kann jemand einen Sinn daraus machen. (Ableitung von (9) bis (10) und Übung 1)
Leo

Antworten:


17

Ich bin mir nicht sicher, ob ich Ihre Frage richtig verstanden habe. Ich werde versuchen zu antworten: versuche zu schreiben als Funktion vonu=t(b-a): Dies ist natürlich, da Sie eine Grenze ine u 2 wollen

abaetb+bbaeta
u=t(ba) .eu28

Mithilfe dieser Erfahrung werden Sie wissen, dass es besser ist, sie in der Form zu schreiben . Dann ist z. B. ( u ) = - aeg(u) führt zu g ( u )

eg(u)=abaetb+bbaeta
mitγ=- a
g(u)=log(abaetb+bbaeta)=log(eta(abaet(ba)+bba))=ta+log(γeu+(1γ))=γu+log(γeu+(1γ)),
.γ=aba

Ist das die Art von Sache, nach der Sie gefragt haben?

Edit: ein paar Kommentare zum Proof

  1. Der erste Trick verdient eine sorgfältige Prüfung: Wenn eine konvexe Funktion ist und a X b eine zentrierte Zufallsvariable ist, dann ist E ( ϕ ( X ) ) - aϕaXb wobeiX0die durchPdefinierte diskrete Variable ist (X0=a)
    E(ϕ(X))abaϕ(b)+bbaϕ(a)=E(ϕ(X0)),
    X0 Als Ergebnis erhalten Sie, dassX0die zentrierte Variable mit Unterstützung in[a,b] ist,die die höchste Varianz aufweist: Var(X)=E(X2)E(X20)=ba2-ab2
    P(X0=a)=bbaP(X0=b)=aba.
    X0[a,b] Beachten Sie, dass wenn wir eine Stützbreite(b-a)festlegen, diese kleiner als(b-a)2 ist
    Var(X)=E(X2)E(X02)=ba2ab2ba=ab.
    (ba) wie Dilip in den Kommentaren sagt, liegt dies daran, dass(b-a)2+4ab0 ist; Die Grenze ist erreicht füra=-b.(ba)24(ba)2+4ab0a=b
  2. u=t(ba)XE(etX)s(t)ba=1s(t(ba))s(t)

    E(ϕ(X))E(ϕ(tX))E(ϕ(tX0))uγu=u0=t0(b0a0)γ=γ0=a0b0a0t,a,bt=t0αa=αa0b=αa0

    abaϕ(tb)+bbaϕ(ta)=a0b0a0ϕ(tb0)+b0b0a0ϕ(a0).
    u
  3. guγ

    γ=aba1γ=bbaat=γubt=(1γ)u

    E(ϕ(tX))abaϕ(tb)+bbaϕ(ta)=γϕ((1γ)u)+(1γ)ϕ(γu)


    ϕ=exp

Ich hoffe, ich habe es ein wenig geklärt.


das ist genau das, wonach ich gesucht habe. Danke vielmals.
Anand

1
@Anand ich weiß, dass es schwierig ist, Ratschlägen zu folgen, aber ich denke, Sie sollten sich nicht zunächst auf technische Details konzentrieren, sondern herausfinden, warum eine solche Bindung existieren kann ... dann sollte der Beweis einfacher erscheinen. Ich habe versucht, Ihnen das Warum im zweiten Teil zu zeigen, der heute Morgen hinzugefügt wurde (Sie müssen über eine Frage wie diese schlafen - zumindest muss ich das tun). Ich finde es schrecklich, dass diese Art von Intuitionen in den meisten Lehrbüchern nicht vorkommt ... selbst wenn man den technischen Teil bekommt, sieht alles magisch aus, solange man nicht die Ideen hat. Vielen Dank und CrossV, dass Sie mir die Möglichkeit gegeben haben, ausführlich darüber nachzudenken!
Elvis

1
E[etX]eE[t2X2/2]=e(t2/2)E[X2]=e(t2/2)var(X)et2σmax2/2?
Dilip Sarwate

@ Elvis Vielen Dank für den Rat und dafür, dass Sie sich die Zeit genommen haben, den intuitiven Teil aufzuschreiben. Ich muss etwas Zeit aufwenden, um das zu verstehen!
Anand

1
@Elvis Taking about intuition, I want to clarify my understanding. To get sharper bounds one needs higher moments. Markov uses the first moment, Chebyshev the second moment and the Hoeffding uses mgf. Is this correct? If someone can expand and clarify this part it would be great.
Anand
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.