Wie man den gierigen Algorithmus beweist, ist richtig

Ich habe einen gierigen Algorithmus, von dem ich vermute, dass er richtig ist, aber ich bin mir nicht sicher. Wie überprüfe ich, ob es korrekt ist? Was sind die Techniken, um zu beweisen, dass ein gieriger Algorithmus korrekt ist? Gibt es gemeinsame Muster oder Techniken?

^{Ich hoffe, dass dies eine Referenzfrage wird, auf die Anfänger verweisen können. daher sein weiter gefasster Anwendungsbereich. Bitte achten Sie darauf, allgemeine, didaktisch aufbereitete Antworten zu geben, die an mindestens einem Beispiel illustriert sind, aber dennoch viele Situationen abdecken. Vielen Dank!}

— DW
quelle

cs.stackexchange.com/q/65284/755

— DW

Können wir beweisen, dass ein gieriger Algorithmus korrekt ist, indem wir ein Matroid oder ein Greedoid verwenden?

— ZDM

Letztendlich benötigen Sie einen mathematischen Korrektheitsnachweis. Ich werde im Folgenden auf einige Beweistechniken eingehen, aber bevor ich darauf eingehe, möchte ich Ihnen einige Zeit sparen: Bevor Sie nach einem Beweis suchen, versuchen Sie es mit zufälligen Tests.

Zufällige Tests

Als ersten Schritt empfehle ich Ihnen, Ihren Algorithmus anhand von Zufallstests zu testen. Es ist erstaunlich, wie effektiv dies ist: Meiner Erfahrung nach scheint zufälliges Testen für gierige Algorithmen unangemessen effektiv zu sein. Verbringen Sie 5 Minuten damit, Ihren Algorithmus zu verschlüsseln, und sparen Sie sich möglicherweise ein oder zwei Stunden, um einen Beweis zu finden.

Die Grundidee ist einfach: Implementieren Sie Ihren Algorithmus. Implementieren Sie auch einen Referenzalgorithmus, von dem Sie wissen, dass er korrekt ist (z. B. einen, der alle Möglichkeiten ausgiebig ausprobiert und das Beste ausnutzt). Es ist in Ordnung, wenn Ihr Referenzalgorithmus asymptotisch ineffizient ist, da Sie dies nur auf kleinen Probleminstanzen ausführen. Generieren Sie dann nach dem Zufallsprinzip eine Million kleiner Probleminstanzen, führen Sie beide Algorithmen aus und überprüfen Sie, ob Ihr Kandidatenalgorithmus in jedem Fall die richtige Antwort gibt.

Empirisch werden Sie dies häufig bei zufälligen Tests feststellen, wenn der Algorithmus Ihres Kandidaten für eine Gier inkorrekt ist. Wenn es in allen Testfällen richtig zu sein scheint, sollten Sie mit dem nächsten Schritt fortfahren: der Erstellung eines mathematischen Beweises für die Richtigkeit.

Mathematische Korrektheitsnachweise

OK, wir müssen also beweisen, dass unser gieriger Algorithmus korrekt ist: dass er die optimale Lösung ausgibt (oder, wenn es mehrere optimale Lösungen gibt, die gleich gut sind, dass er eine davon ausgibt).

Das Grundprinzip ist intuitiv:

Prinzip: Wenn Sie nie eine schlechte Wahl treffen, tun Sie alles in Ordnung.

Gierige Algorithmen beinhalten normalerweise eine Folge von Auswahlmöglichkeiten. Die grundlegende Beweisstrategie ist, dass wir versuchen, zu beweisen, dass der Algorithmus niemals eine schlechte Wahl trifft. Gierige Algorithmen können nicht zurückverfolgen - sobald sie eine Entscheidung getroffen haben, sind sie festgeschrieben und werden diese Entscheidung niemals rückgängig machen -, daher ist es wichtig, dass sie niemals eine schlechte Entscheidung treffen.

Was wäre eine gute Wahl? Wenn es eine einzige optimale Lösung gibt, ist es leicht zu erkennen, was eine gute Wahl ist: jede Wahl, die mit der von der optimalen Lösung getroffenen identisch ist. Mit anderen Worten, wir werden versuchen zu beweisen, dass zu jedem Zeitpunkt der Ausführung der Greedy-Algorithmen die bisher vom Algorithmus getroffene Auswahlsequenz genau mit einem Präfix der optimalen Lösung übereinstimmt. Wenn es mehrere gleich gute optimale Lösungen gibt, ist eine gute Wahl eine, die mit mindestens einem der Optima übereinstimmt. Mit anderen Worten, wenn die Auswahlreihenfolge des Algorithmus bisher mit einem Präfix einer der optimalen Lösungen übereinstimmt, ist bis jetzt alles in Ordnung (es ist noch nichts schiefgegangen).

Um das Leben zu vereinfachen und Ablenkungen zu vermeiden, konzentrieren wir uns auf den Fall, dass es keine Bindungen gibt: Es gibt eine einzige, einzigartige optimale Lösung. Alle Maschinen werden auf den Fall übertragen, dass es ohne grundlegende Änderungen mehrere gleich gute Optima geben kann, aber Sie müssen ein bisschen vorsichtiger mit den technischen Details umgehen. Ignorieren Sie zunächst diese Details und konzentrieren Sie sich auf den Fall, in dem die optimale Lösung einzigartig ist. So können Sie sich auf das Wesentliche konzentrieren.

Es gibt ein sehr verbreitetes Beweismuster, das wir verwenden. Wir werden hart arbeiten, um die folgende Eigenschaft des Algorithmus zu beweisen:

Behauptung: Sei die vom Algorithmus ausgegebene Lösung und $S$ $O$ die optimale Lösung. Wenn unterscheidet sich von ist , dann können wir optimieren eine andere Lösung zu erhalten , die sich von ist und streng besser als . $S$ $O$ $O$ $O^*$ $O$ $O$

Beachten Sie, warum dies nützlich ist. Wenn die Behauptung wahr ist, folgt, dass der Algorithmus korrekt ist. Dies ist im Grunde ein Beweis durch Widerspruch. Entweder ist dasselbe wie oder es ist anders. Wenn es anders ist, können wir eine andere Lösung finden $S$ $O$ , die als streng besser $O^*$ $O$ - aber das ist ein Widerspruch, wie wir definierten die optimale Lösung zu sein , und es kann keine Lösung sein , die als besser. Wir sind gezwungen zu folgern, dass nicht anders sein kann als ; muss immer gleich $O$ $S$ $O$ $S$ $O$ Das heißt, der Greedy-Algorithmus gibt immer die richtige Lösung aus. Wenn wir die Behauptung oben beweisen können, haben wir unseren Algorithmus als korrekt erwiesen.

Fein. Wie beweisen wir die Behauptung? Wir denken an eine Lösung als einen Vektor der der Folge von Auswahlen entspricht, die vom Algorithmus getroffen wurden, und ebenso denken wir an die optimale Lösung als einen Vektor entsprechend der Reihenfolge der Entscheidungen, die zu führen würden . Wenn von verschieden ist , muss ein Index bei dem $S$ $(S_1,\dots,S_n)$ $n$ $O$ $(O_1,\dots,O_n)$ $O$ $S$ $O$ $i$ ; wir werden uns auf das kleinste konzentrieren, wie . Dannwir zwicken , indem ein wenig in der - ten Position Spiel ,heißt, werden wir die optimale Lösung optimieren durch die Änderung - te Wahl auf die von der GreedyAlgorithmus Auserwählte, und dann Wir werden zeigen, dass dies zu einer noch besseren Lösung führt. Insbesondere definieren wir als so etwas wie $S_i \ne O_i$ $i$ $O$ $O$ $i$ $S_i$ $O$ $i$ $O^*$

O^{*} = (O_{1}, O_{2}, \dots, O_{ich - 1}, S_{ich}, O_{ich + 1}, O_{ich + 2}, \dots, O_{n}),

$O^* = (O_1,O_2,\dots,O_{i-1},S_i,O_{i+1},O_{i+2},\dots,O_n),$

mit der Ausnahme, dass wir den -Teil häufig leicht ändern müssen, um die globale Konsistenz zu gewährleisten. Ein Teil der Beweisstrategie beinhaltet ein gewisses Maß an Klugheit bei der Definition von . Dann wird das Fleisch des Beweises darin bestehen, Fakten über den Algorithmus und das Problem zu verwenden, um zu zeigen, dass streng besser als $O_{i+1},O_{i+2},\dots,O_n$ $O^*$ $O^*$ $O$ ; Hier benötigen Sie einige problemspezifische Einblicke. Irgendwann müssen Sie sich mit den Details Ihres spezifischen Problems befassen. Dies vermittelt Ihnen jedoch einen Eindruck von der Struktur eines typischen Korrektheitsnachweises für einen gierigen Algorithmus.

Ein einfaches Beispiel: Teilmenge mit maximaler Summe

Dies ist möglicherweise einfacher zu verstehen, wenn Sie ein einfaches Beispiel im Detail durcharbeiten. Betrachten wir das folgende Problem:

Eingabe: Eine Menge von ganzen Zahlen, eine ganze Zahl Ausgabe: Eine Menge der Größe deren Summe so groß wie möglich ist $U$ $k$
$S \subseteq U$ $k$

Es gibt einen natürlichen Greedy-Algorithmus für dieses Problem:

Setze . $S := \emptyset$
Für :
- Sei die größte Zahl in , die noch nicht ausgewählt wurde (dh $x_i$ $U$ $i$ -größte Zahl in ). Hinzufügen $U$ zu . $x_i$ $S$

Zufällige Tests legen nahe, dass dies immer die optimale Lösung ergibt. Lassen Sie uns also formal beweisen, dass dieser Algorithmus korrekt ist. Beachten Sie, dass die optimale Lösung einzigartig ist, sodass wir uns nicht um Krawatten kümmern müssen. Lassen Sie uns die oben skizzierte Behauptung beweisen:

Behauptung: Sei die von diesem Algorithmus ausgegebene Lösung am Eingang und die optimale Lösung. Wenn $S$ $U,k$ $O$ , können wir eine andere Lösung konstruieren $S \ne O$ deren Summe noch größer als . $O^*$ $O$

Beweis. Angenommen, , und sei der Index der ersten Iteration, in der . (Ein solcher Index muss existieren, da wir und nach der Definition des Algorithmus .) Da (nach Annahme) minimal ist, müssen wir haben $S \ne O$ $i$ $x_i \notin O$ $i$ $S \ne O$ $S=\{x_1,\dots,x_k\}$ $i$ und insbesondere $x_1,\dots,x_{i-1} \in O$ hat die Form , wobei die Zahlen $O$ $O=\{x_1,x_2,\dots,x_{i-1},x'_i,x'_{i+1},\dots,x'_n\}$ $x_1,\dots,x_{i-1},x'_i,\dots,x'_n$ sind in absteigender Reihenfolge aufgeführt. Wenn wir uns ansehen, wie der Algorithmus auswählt , sehen wir, dass wir für alle . Insbesondere gilt . Definiere also , dh wir erhalten indem wir die te Zahl in löschen $x_1,\dots,x_i$ $x_i > x'_j$ $j\ge i$ $x_i > x'_i$ $O^ = O \cup \{x_i\} \setminus \{x'_i\}$ $O^*$ $i$ $O$ und Hinzufügen von . Nun ist die Summe der Elemente von die Summe der Elemente von plus und , so dass die Summe von streng größer als die Summe von . Dies beweist die Behauptung. $x_i$ $O^*$ $O$ $x_i-x'_i$ $x_i-x'_i>0$ $O^*$ $O$ $\blacksquare$

Die Intuition hier ist, dass, wenn der gierige Algorithmus jemals eine Wahl trifft, die mit inkonsistent ist , wir beweisen können, dass noch besser sein könnte, wenn es so modifiziert würde, dass es das Element enthält, das zu diesem Zeitpunkt vom gierigen Algorithmus ausgewählt wurde. Da optimal ist, kann es unmöglich einen Weg geben, es noch besser zu machen (das wäre ein Widerspruch). Die einzige verbleibende Möglichkeit ist, dass unsere Annahme falsch war: Mit anderen Worten, der gierige Algorithmus wird niemals eine Wahl treffen das heißt nicht mit . $O$ $O$ $O$ $O$

Dieses Argument wird oft als Austauschargument oder Austauschlemma bezeichnet . Wir fanden den ersten Ort, an dem sich die optimale Lösung von der gierigen Lösung unterscheidet, und stellten uns vor, dieses Element von gegen die entsprechende gierige Wahl auszutauschen (ausgetauschtes $O$ $x'_i$ gegen ). Einige Analysen haben gezeigt, dass dieser Austausch nur die optimale Lösung verbessern kann - aber per Definition kann die optimale Lösung nicht verbessert werden. Die einzige Schlussfolgerung ist also, dass es keinen Ort geben darf, an dem sich die optimale Lösung von der gierigen Lösung unterscheidet. Wenn Sie ein anderes Problem haben, suchen Sie nach Möglichkeiten, dieses Austauschprinzip in Ihrer spezifischen Situation anzuwenden. $x_i$

— DW
quelle

Dies ist eine alte Frage, aber für mich das erste Ergebnis in Google. Die Leitung then we can tweak O to get another solution O∗ that is different from O and strictly better than Overwirrt mich. Wenn es mehrere optimale Lösungen gibt, ist es möglich, dass S != Obeide immer noch optimal sind. wir können O optimieren, um "eher wie" S zu sein (O ∗ zu erschaffen) und dennoch genauso gut zu sein wie (nicht strictly better than) O.

— citelao

@ Citelao, es tut mir leid zu hören, dass es Sie verwirrt. Leider bin ich mir nicht sicher, wie ich es deutlicher erklären soll. Ja, es kann mehrere optimale Lösungen geben, die alle denselben Wert haben. Das ist richtig. Was Sie geschrieben haben und was ich geschrieben habe, sind beide gültig; es gibt keinen widerspruch. Der Unterschied besteht darin, dass das, was Sie geschrieben haben, nicht dazu beiträgt, einen gierigen Algorithmus als richtig zu beweisen. was ich geschrieben habe macht. Ich kann nur vorschlagen, das, was ich geschrieben habe, noch einmal durchzugehen und zu prüfen, ob Sie herausfinden können, wie nützlich das ist, was ich geschrieben habe. Wenn das nicht hilft, finden Sie vielleicht einen anderen Artikel. Mir ist klar, dass es schwierig und verwirrend ist.

— DW

Danke für die schnelle Antwort! Ich habe den Punkt verpasst, an dem Sie sich darauf konzentrieren, den Algorithmus zu beweisen, wenn es ihn nur gibt a single, unique optimal solution. Da es bei dieser Frage darum geht, jeden gierigen Algorithmus als richtig zu beweisen , möchte ich eine Antwort für Fälle geben, in denen mehrere optimale Lösungen existieren können. Es ist schon eine Weile her, dass ich all dies studiert habe, aber reicht es nicht aus, zu beweisen, dass Sie jedes Element O_i in einer optimalen Lösung O austauschen können, die sich von der alg unterscheidet. Lösung S mit S_i und noch eine Lösung O ', die nicht schlechter als O ist?

— Citelao

@citelao, die Technik gilt auch für Fälle, in denen es mehrere optimale Lösungen gibt. Ich schlug vor, mich auf den Fall zu konzentrieren, in dem die optimale Lösung nur dann einzigartig ist, wenn Sie dies zum ersten Mal sehen, ist es einfacher zu verstehen, wie diese Beweise in dieser Umgebung funktionieren. Die gleiche Strategie funktioniert jedoch auch, wenn es mehrere optimale Lösungen gibt. Ich schlage vor, dies zu untersuchen, um sicherzustellen, dass Sie verstehen, wie es funktioniert, wenn es eine einzige optimale Lösung gibt, und es dann auf den allgemeinen Fall anzuwenden. Ich denke auch, dass es für Sie hilfreich sein könnte, ein paar Beispielbeweise für gierige Algorithmen zu studieren.

— DW

Um Ihre letztere Frage zu beantworten, reicht das nicht aus. Das beweist nicht, dass S optimal ist. (Wenn Sie nur fordern, dass O 'nicht schlechter als O ist, gibt es Fälle, in denen S nicht optimal ist, es jedoch möglich ist, diese Art von Austausch durchzuführen. Dies beweist, dass es möglich ist, ein O' zu erzielen, das nicht schlechter ist als O nicht Ich kann nicht beweisen, ob S optimal ist und nicht, dass der gierige Algorithmus korrekt ist. Ich empfehle, die in der Antwort beschriebene Methode etwas genauer zu untersuchen. Es ist schwierig. Der Beweis durch Widerspruch ist oft schwierig zu verstehen.)

— DW

Ich werde den folgenden einfachen Sortieralgorithmus als Beispiel verwenden:

repeat:
  if there are adjacent items in the wrong order:
     pick one such pair and swap
  else
     break

Um die Richtigkeit zu beweisen, benutze ich zwei Schritte.

Zuerst zeige ich, dass der Algorithmus immer terminiert.
Dann zeige ich, dass die Lösung, bei der es endet, die ist, die ich will.

Für den ersten Punkt wähle ich eine geeignete Kostenfunktion aus, für die ich zeigen kann, dass der Algorithmus sie in jedem Schritt verbessert.

In diesem Beispiel wähle ich die Anzahl der Inversionen in der Eingabeliste. Eine Inversion in einer Liste ist ein Paar von Einträgen , so dass aber . Die Anzahl der Inversionen ist immer nicht negativ und eine sortierte Liste enthält 0 Inversionen. $A$ $A[i]$ $A[j]$ $A[i] > A[j]$ $i<j$

$A[i]$ $A[i+1]$ $A[i],A[i+1]$ , lässt jedoch alle anderen Inversionen unberührt. Daher wird die Anzahl der Inversionen bei jeder Iteration reduziert.

Dies beweist, dass der Algorithmus schließlich beendet wird.

Die Anzahl der Inversionen in einer sortierten Liste ist 0. Wenn alles gut geht, reduziert der Algorithmus die Anzahl der Inversionen auf 0. Wir müssen nur zeigen, dass es nicht in einem lokalen Minimum hängen bleibt.

Normalerweise beweise ich das durch Widerspruch. Ich gehe davon aus, dass der Algorithmus angehalten hat, aber die Lösung nicht korrekt ist. Im Beispiel bedeutet dies, dass die Liste noch nicht sortiert ist, aber keine benachbarten Elemente in der falschen Reihenfolge vorhanden sind.

$A[i]$ $A[j]$ $i<j$ $A[i]>A[j]$ $i$ $j$ $i+1 < j$ $A[i]<A[i+1]$ $A[i+1]<A[j]$ $A[i]<A[j]$

Dies beweist, dass der Algorithmus nur stoppt, wenn die Liste sortiert ist. Und damit sind wir fertig.

— adrianN
quelle

The techniques explained are so general that they virtually have nothing particular about greedy algorithm, the topic of this question.

— Apass.Jack