Ist SAT eine kontextfreie Sprache?

Ich bin die Sprache aller erfüllbar Propositionslogik Formeln unter Berücksichtigung, SAT (um sicherzustellen , dass dies eine endliche Alphabet hat, würden wir propositionaler Buchstaben in geeigneter Weise kodieren [edit: die Antworten darauf hingewiesen , dass die Antwort auf die Frage nicht robust unter sein kann Da die Kodierungen variieren, muss man genauer sein - siehe meine Schlussfolgerungen weiter unten] ). Meine einfache Frage ist

Ist SAT eine kontextfreie Sprache?

Meine erste Vermutung war, dass die heutige Antwort (Anfang 2017) lauten sollte: "Niemand weiß, da dies ungelöste Fragen in der Komplexitätstheorie betrifft." Dies ist jedoch nicht wirklich wahr (siehe Antwort unten), obwohl es auch nicht völlig falsch ist. Hier ist eine kurze Zusammenfassung von Dingen, die wir kennen (beginnend mit einigen offensichtlichen Dingen).

SAT ist nicht regulär (da auch die Syntax der Aussagenlogik aufgrund übereinstimmender Klammern nicht regulär ist)
SAT ist kontextsensitiv (es ist nicht schwer, eine LBA dafür zu vergeben)
SAT ist NP-vollständig (Cook / Levin) und wird insbesondere von nicht deterministischen TMs in der Polynomzeit bestimmt.
SAT kann auch von nichtdeterministischen Einweg-Stapelautomaten (1-NSA) erkannt werden (siehe WC-Runden, Komplexität der Erkennung in Sprachen der Mittelstufe , Switching and Automata Theory, 1973, 145-158 http://dx.doi.org/ 10.1109 / SWAT.1973.5 )
Das Wort Problem für kontextfreie Sprachen hat eine eigene Komplexitätsklasse (siehe https://complexityzoo.uwaterloo.ca/Complexity_Zoo:C#cfl ) $\textbf{CFL}$
, wobei die auf reduzierbare Klasse von Problemen ist(siehehttps://complexityzoo.uwaterloo.ca/Complexity_Zoo:L#logcfl). Es ist bekannt, dass . $\textbf{CFL}\subseteq\textbf{LOGCFL}\subseteq\textbf{AC}^{\textbf{1}}$ $\textbf{LOGCFL}$ $\textbf{CFL}$ $\textbf{NL}\subseteq\textbf{LOGCFL}$
Es ist nicht bekannt, ob oder (in der Tat ist sogar offen; ich glaube, ich habe dies von S. Arora, B. Barak erhalten: Computational Complexity: A Modern Approach ; Cambridge University Press 2009) . Daher kann es kein vollständiges Problem geben, von dem bekannt ist, dass es nicht in . Daher muss unbekannt sein, ob SAT in . $\textbf{NL}\subsetneq\textbf{NP}$ $\textbf{NL}=\textbf{NP}$ $\textbf{NC}^{\textbf{1}}\subsetneq\textbf{PH}$ $\textbf{NP}$ $\textbf{LOGCFL}$ $\textbf{LOGCFL}$

Dieser letzte Punkt lässt jedoch immer noch die Möglichkeit offen, dass SAT bekanntermaßen nicht in der . Im Allgemeinen konnte ich nicht viel über die Beziehung von zur Hierarchie herausfinden , was dazu beitragen könnte, den epistemischen Status meiner Frage zu klären. $\textbf{CFL}$ $\textbf{CFL}$ $\textbf{NC}$

Bemerkung (nachdem ich einige erste Antworten gesehen habe): Ich erwarte nicht, dass die Formel in konjunktiver normaler Form vorliegt (dies wird keinen Unterschied zum Wesen der Antwort machen, und normalerweise gelten immer noch Argumente, da ein CNF auch eine Formel ist behaupten, dass die Konstante-Anzahl-von-Variablen-Version des Problems regelmäßig ist, schlägt fehl, da man Klammern für die Syntax benötigt.).

Fazit: Entgegen meiner von der Komplexitätstheorie inspirierten Annahme kann man direkt zeigen, dass SAT nicht kontextfrei ist. Die Situation ist daher:

Es ist bekannt , dass SAT ist nicht kontextfrei (mit anderen Worten: SAT nicht in ist ), unter der Annahme , dass man eine „direkte“ Codierung verwendet der Formeln in denen Aussagenvariablen durch Binärzahlen gekennzeichnet sind (und einige weitere Symbole verwendet werden , für Betreiber und Abscheider). $\textbf{CFL}$
Es ist nicht bekannt, ob SAT in $\textbf{LOGCFL}$ , aber "die meisten Experten glauben", dass dies nicht der ist, da dies implizieren würde . Dies bedeutet auch, dass es nicht bekannt ist, ob andere "vernünftige" Kodierungen von SAT kontextfrei sind (vorausgesetzt, wir würden Logspace als akzeptablen Kodierungsaufwand für ein NP-hartes Problem betrachten). $\textbf{P}=\textbf{NP}$

Beachten Sie, dass diese beiden Punkte nicht implizieren . Dies kann direkt gezeigt werden, indem gezeigt wird, dass es Sprachen in (daher in ) gibt, die nicht kontextfrei sind (z. B. $\textbf{CFL}\subsetneq\textbf{LOGCFL}$ $\textbf{L}$ $\textbf{LOGCFL}$ ). $a^nb^nc^n$

— mak
quelle

Wenn ja, dann ist P = NP.

— Ryan

Wenn SAT kontextfrei wäre, würde die dynamische Programmierung (der CYK-Algorithmus) einen polynomiellen Zeitalgorithmus zum Testen der Zugehörigkeit zu SAT ergeben, was P = NP ergibt. Selbst P = NP würde nicht bedeuten, dass SAT kontextfrei ist. Diese Kodierung von Variablen scheint wichtiger zu sein, als Sie es zu schätzen wissen. Ich habe die Details nicht ausgearbeitet, aber wenn Sie unäre oder binäre "Indizes" zu den Variablen hinzugefügt haben, haben Sie meiner Meinung nach Probleme, (x und y) von (x und nicht x) für ausreichend große Indizes zu unterscheiden.

— AdamF

Sie müssen die Darstellung genau kennen, bevor Sie P = NP-Schlussfolgerungen ziehen. Zum Beispiel ist die Faktorisierung einer Zahl N eine Polynomzeit in N (die interessante Frage betrifft die Anzahl der Bits, die zum Schreiben von N in Binärform benötigt werden, oder log N).

— Aryeh

Ich war mir der Schlussfolgerung von P = NP bewusst und dass die Antwort daher nicht "Ja" lauten sollte (entschuldige, dass ich ein wenig provokativ war, wie ich das formuliert habe ;-). Ich habe mich immer noch gefragt, ob dies wirklich bekannt ist oder nur etwas, was "die meisten Experten glauben" (die Antworten zeigen jetzt deutlich, dass ersteres zutrifft; ich werde eines zu gegebener Zeit auswählen).

— Mak

Antworten:

Nur ein alternativer Beweis mit einer Mischung bekannter Ergebnisse.

Nehme an, dass:

Variablen werden mit dem regulären Ausdruck ausgedrückt $d = (+|-)1(0|1)^*$
und dass die ( reguläre ) Sprache (über die zur Darstellung von CNF-Formeln verwendet wird, ist: ; Beachten Sie nur, dass alle gültigen CNF-Formeln bis zur Variablenumbenennung erfasst. $\Sigma = \{0,1,+,-,\land,\lor\})$ $S = \{ d^+ (\lor d^+)^*(\land (d^+ (\lor d^+)^*))^* \}$ $S$

Zum Beispiel wird folgt geschrieben: (der Operator hat Vorrang vor $\varphi = (x_1 \lor x_2) \land -x_3$ $s_{\varphi} = +1 \lor +10 \land -11 \in S$ $\lor$ $\land$ ).

Angenommen, st die entsprechende Formel ist erfüllbar $L = \{ s_{\varphi} \in S \, \mid$ $\varphi$ $\}$ ist CF.

Wenn wir schneiden sie mit der regulären Sprache: wir noch eine CF Sprache erhalten. Wir können auch den Homomorphismus anwenden: , und die Sprache bleibt CF. $R = \{ +1^a \land -1^b \land -1^c \mid a,b,c > 0 \}$ $h(+) = \epsilon$ $h(-) = \epsilon$

Aber die Sprache, die wir erhalten, ist: , denn wenn dann ist die "Quellen" -Formel was nicht befriedigend ist (ähnlich wenn ). Aber ist eine bekannte Nicht-CF-Sprache Widerspruch. $L' = \{ 1^a \land 1^b \land 1^c \mid a \neq b, a \neq c\}$ $a=b$ $+x_a \land -x_a \land -x_b$ $a=c$ $L'$ $\Rightarrow$

— Marzio De Biasi
quelle

Ich habe diese Antwort jetzt akzeptiert, da es noch ein offenes Problem mit dem anderen Ansatz gibt (siehe Kommentare), und ich mag das etwas grundlegendere Argument. Es mag nett sein zu betonen, dass das Argument spezifisch für die gewählte Codierung ist und es in der Tat unbekannt ist, ob man eine andere einfache (logspace) Codierung finden kann, die zu einer kontextfreien Sprache führt.

— Mak

@mak: Ich vermute, dass jede andere "vernünftige" Kodierung von SAT mit einer ähnlichen Technik als nicht-CF erwiesen werden kann. Vielleicht wäre eine andere interessante Richtung zu untersuchen, ob wir irgendeine Art von Diagonalisierung anwenden können, um einen allgemeineren Beweis zu erhalten: Die SAT-Formel codiert eine Berechnung, die ein Herunterdrücken von Automaten für eine bestimmte Eingabe simuliert, und ist dann und nur dann erfüllbar, wenn dies nicht der Fall ist. ' Ich akzeptiere es nicht. Aber es ist nur eine unscharfe Idee ...

— Marzio De Biasi

Überprüfen Sie, ob eine Zeichenfolge in einer regulären Sprache vorliegt. Dann ist NP = coNP. L sei in Reg. Betrachten Sie die Formel, die wahr ist, wenn sie nicht in L ist. Sie ist in NP, sodass sie als SAT-Formel ausgedrückt werden kann. Es ist in der Sprache, wenn es nicht ist.

— Kaveh

Wenn die Anzahl der Variablen endlich ist, ist auch die Anzahl der erfüllbaren Konjunktionen endlich (und daher regelmäßig). [Bearbeiten: Diese Behauptung nimmt das CNFSAT-Formular an.]

Ansonsten stimmen wir zu, Formeln wie mit zu codieren $(x_{17}\vee \neg x_{21})\wedge (x_{1}\vee x_{2}\vee x_3)$ . Wir werdenOgdens Lemma verwenden, um zu beweisen, dass die Sprache aller erfüllbaren Konjunktionen nicht kontextfrei ist. $(17+\tilde{} 21)(1+2+3)$

Sei die "Markierungs" -Konstante in Ogdens Lemma und betrachte eine Sat-Formel deren erster Satz aus - das heißt, die Kodierung von , wobei die Dezimalzahl ist, die aus Einsen. Wir markieren die von und fordern dann, dass alle Pumpungen der entsprechenden Zerlegung von (siehe die Schlussfolgerung von Ogdens Lemma) auch erfüllbar sind. Aber wir können dies leicht blockieren, indem wir verlangen, dass keine Klausel , wobei eine Folge von ist $p$ $w$ $(1^p)$ $(x_N)$ $N$ $p$ $p$ $1^p$ $w$ $x_q$ $q$ kürzer als , sei erfüllbar - zum Beispiel indem sichergestellt wird, dass jede zweite Klausel von eine Negation von jedem solchen . Dies bedeutet, dass die Eigenschaft "negatives Pumpen" nicht erfüllt, und wir schließen daraus, dass die Sprache nicht kontextfrei ist. [Anmerkung: Ich habe die trivialen Fälle ignoriert, in denen das Pumpen schlecht geformte Saiten erzeugt.] $1$ $p$ $w$ $x_q$ $w$

— Aryeh
quelle

Hinweis: In meiner Behauptung, dass die Sprache für eine endliche Anzahl von Variablen endlich ist, lehne ich implizit ab, eine Variable innerhalb eines Satzes oder eines Satzes viele Male unbegrenzt zu wiederholen

— Aryeh

... Aber ich denke, die Sprache ist immer noch regelmäßig, weil man die endliche Sammlung von "im Wesentlichen verschiedenen" (dh ohne triviale Wiederholungen) Formeln nimmt und dann die verschiedenen Wiederholungen zulässt.

— Aryeh

Der Anspruch mit der Regelmäßigkeit funktioniert nur für CNFSAT (ich habe meine Frage geklärt).

— mak

Selbst bei willkürlichen Nicht-CNF-Formeln in endlich vielen Variablen ist die Erfüllbarkeit (und jede Sprache, die zwei logisch äquivalente Formeln nicht unterscheiden kann) leicht als kontextfrei anzusehen. Die Relevanz sehe ich jedoch nicht. Die Erfüllbarkeit von Formeln in endlich vielen Variablen ist ein triviales Problem, das nichts mit der Komplexität von SAT zu tun hat.

— Emil Jeřábek unterstützt Monica am

| x y z |

$|xyz|$