Konkretes Verständnis des Unterschieds zwischen PP- und BPP-Definitionen

9

Ich bin verwirrt darüber, wie PP und BPP definiert sind. Nehmen wir an , ist die charakteristische Funktion für eine Sprache . M ist die probabilistische Turingmaschine. Sind die folgenden Definitionen korrekt: $\chi$ $\mathcal{L}$
$BPP =\{\mathcal{L} :Pr[\chi(x) \ne M(x)] \geq \frac{1}{2} + \epsilon \quad \forall x \in \mathcal{L},\ \epsilon > 0 \}$
$PP =\{\mathcal{L} :Pr[\chi(x) \ne M(x)] > \frac{1}{2} \}$

Wenn die Definition falsch ist, versuchen Sie bitte, minimale Änderungen vorzunehmen, um sie zu korrigieren (dh geben Sie keine andere äquivalente Definition an, die eine Zählmaschine oder ein modifiziertes Modell verwendet). Ich kann die Wahrscheinlichkeitsbedingungen in beiden Definitionen nicht richtig unterscheiden.

Einige konkrete Beispiele mit klarem Einblick in die subtilen Punkte wären sehr hilfreich.

— DurgaDatta
quelle

10

Das sieht für mich richtig aus. Der Unterschied zwischen BPP und PP ist , dass für die BPP die Wahrscheinlichkeit größer ist als sein muß durch eine Konstante , während für PP es sein könnte . Bei BPP-Problemen können Sie die Wahrscheinlichkeitsverstärkung mit einer kleinen Anzahl von Wiederholungen durchführen, bei allgemeinen PP-Problemen jedoch nicht. $1/2$ $1/2+ 1/2^n$

— adrianN
quelle

12

Vor's Antwort gibt die Standarddefinition. Lassen Sie mich versuchen, den Unterschied etwas intuitiver zu erklären.

Sei ein Algorithmus mit begrenzter fehlerwahrscheinlicher Polynomzeit für eine Sprache , die mit einer Wahrscheinlichkeit von mindestens korrekt antwortet $M$ $L$ . Seidie Eingabe unddie Größe der Eingabe. $p\geq\frac{1}{2}+\delta$ $x$ $n$

Was einen beliebigen -Algorithmus von einem -Algorithmus unterscheidet, ist die positive Lücke zwischen der Wahrscheinlichkeit, akzeptieren, und der Wahrscheinlichkeit, akzeptieren . $\mathsf{PP}$ $\mathsf{BPP}$ $x\in L$ $x\notin L$ Das Wesentliche an ist, dass die Lücke mindestens beträgt . Ich werde versuchen zu erklären, warum diese Unterscheidung von Bedeutung ist und es uns ermöglicht, als effiziente Algorithmen zu betrachten (sogar als $\mathsf{BPP}$ $n^{-O(1)}$ $\mathsf{BPP}$ $\mathsf{P}$ ) wohingegen als ineffizient angesehen wird (tatsächlich enthält ). All dies kommt von dieser Lücke. $\mathsf{PP}$ $\mathsf{PP}$ $\mathsf{NP}$

Beginnen wir mit einem genaueren Blick auf $\mathsf{PP}$

Es ist zu beachten, dass, wenn ein Algorithmus während seiner Ausführung höchstens Zufallsbits verwendet und die Fehlerwahrscheinlichkeit kleiner als ist, die Fehlerwahrscheinlichkeit tatsächlich , es keine Auswahl von Zufallsbits geben kann, die den Algorithmus machen antworte falsch. $r(n)$ $2^{-r(n)}$ $0$

Darüber hinaus kann ein Algorithmus mit der Laufzeit nicht mehr als Zufallsbits verwenden. Wenn also der Fehler eines probabilistischen Algorithmus mit der Laufzeit ungünstigsten Fall besser ist als $t(n)$ $t(n)$ $t(n)$

Mit einem ähnlichen Argument können wir zeigen, dass der Fall, in dem der Unterschied zwischen der Wahrscheinlichkeit, ein zu akzeptieren, und der Wahrscheinlichkeit, ein zu akzeptieren, zu gering ist, dem Fall ähnlich ist, in dem wir fast keinen Unterschied wie in haben Fall. $x\in L$ $x\notin L$ $\mathsf{PP}$

Lassen Sie uns nun in Richtung bewegen . $\mathsf{BPP}$

In probabilistischen Algorithmen können wir die Wahrscheinlichkeit für eine korrekte Antwort erhöhen. Angenommen, wir möchten die Korrektheitswahrscheinlichkeit auf erhöhen, beispielsweise die Fehlerwahrscheinlichkeit (exponentiell kleiner Fehler). $1-\epsilon$ $\epsilon=2^{-n}$

Die Idee ist einfach: Führen Sie mehrmals aus und nehmen Sie die Antwort der Mehrheit. $M$

Wie oft sollten wir ausführen , um die Fehlerwahrscheinlichkeit auf höchstens ? mal. Der Beweis wird am Ende dieser Antwort gegeben. $M$ $\epsilon$ $\Theta(\delta^{-1} \lg \epsilon)$

$M$ $\Theta(\delta^{-1} \ln \epsilon) = n^{O(1)}$

δ^{- 1} \lg ϵ = n^{O (1)}

$\delta^{-1} \lg \epsilon = n^{O(1)}$

$\epsilon$ $2^{-n}$ $n$ $\frac{1}{2}-n^{O(1)}$

$\delta$ $0$ $2^{-n}$ $n^{-\omega(1)}$ $\mathsf{BPP}$

$\mathsf{BPP}$

$\mathsf{PP}$

$\epsilon$ $(\frac{1}{2}-\delta,\frac{1}{2}+\delta)$ $M$ $\Theta(\delta^{-1} \lg \epsilon)$

$N_k$ $M$ $k$ $k$

$x \in L$ $x \notin L$

P r {M (x) accepts} = p \geq \frac{1}{2} + δ

$\mathsf{Pr}\{M(x) \text{ accepts}\} = p \geq \frac{1}{2} + \delta$

N_{k}

$N_k$

k

$k$

$X_i$ $i$ $0$ $X_i$

E [X_{i}] = P r {X_{i} = 1} = P r {M (x) accepts} = p \geq \frac{1}{2} + δ

$\mathbb{E}[X_i] = \mathsf{Pr}\{X_i=1\} = \mathsf{Pr}\{M(x)\text{ accepts}\} = p \geq \frac{1}{2}+\delta$

$Y = \Sigma_{i=1}^k X_i$ $Y\geq\frac{k}{2}$

P r {N_{k} (x) accepts} = P r {Y \geq \frac{k}{2}}

$\mathsf{Pr}\{N_k(x) \text{ accepts}\} = \mathsf{Pr}\{Y \geq \frac{k}{2}\}$

$Z$ $\mu$

P r {| Z - μ | > α μ} < e^{\frac{α^{2}}{4} μ}

$\mathsf{Pr}\{|Z-\mu| > \alpha\mu\} < e^{\frac{\alpha^2}{4}\mu}$

$Z$ $\alpha\mu$ $\mu$ $\alpha$ $Y < \frac{k}{2}$

E [Y] = E [Σ_{i = 1}^{k} X_{i}] = Σ_{i = 1}^{k} E [X_{i}] = k p \geq \frac{k}{2} + k δ

$\mathbb{E}[Y] = \mathbb{E}[\Sigma_{i=1}^k X_i] = \Sigma_{i=1}^k \mathbb{E}[X_i] = kp \geq \frac{k}{2} + k\delta$

$Y< \frac{k}{2}$ $|Y-(\frac{k}{2}+k\delta)| > k\delta$

P r {| Y - k p | > α k p} < e^{- \frac{α^{2}}{4} k p}

$Pr\{|Y - kp| > \alpha kp\} < e^{-\frac{\alpha^2}{4}kp}$

$\alpha$ $\alpha kp = k\delta$ $\alpha = \frac{\delta}{p} \leq \frac{2\delta}{2\delta+1}$

Deshalb haben wir

P r {Y < \frac{k}{2}} \leq P r {| Y - (\frac{k}{2} + k δ) | > k δ} \leq P r {| Y - k p | > α k p} < e^{- \frac{α^{2}}{4} k p}

$Pr\{Y < \frac{k}{2} \} \leq Pr\{|Y - (\frac{k}{2}+k\delta)| > k\delta\} \leq Pr\{|Y - kp| > \alpha kp\} < e^{-\frac{\alpha^2}{4}kp}$

und wenn Sie die Berechnungen durchführen, werden Sie das sehen

\frac{α^{2}}{4} k p \leq \frac{δ^{2}}{4 δ + 2} k = Θ (k δ)

$\frac{\alpha^2}{4}kp \leq \frac{\delta^2}{4\delta+2}k = \Theta(k\delta)$

wir haben

P r {Y < \frac{k}{2}} < e^{- Θ (k δ)}

$Pr\{Y < \frac{k}{2} \} < e^{-\Theta(k\delta)}$

$\epsilon$

e^{- Θ (k δ)} \leq ϵ

$e^{-\Theta(k\delta)} \leq \epsilon$

oder mit anderen Worten

Θ (δ^{- 1} \lg ϵ) \leq k

$\Theta(\delta^{-1} \lg \epsilon) \leq k$

$N_k$ $k$ $M$

$\frac{1}{2}$

— Kaveh
quelle

7

Verwenden Sie Ihre Notation:

$BPP =\{L : \exists$ $M,$ $0 < c \leq 1/2$ $\forall x \; Pr[\chi_L(x) = M(x)] \geq \frac{1}{2} + c\}$

$PP =\{L : \exists$ $M$ $\forall x \; Pr[\chi_L(x) = M(x)] > \frac{1}{2}\}$

Auf den Unterschied wurde von adrianN hingewiesen, und Sie können auch einen Blick auf Wikipedia PP vs BPP werfen

— Vor
quelle