DFA-Schnittmenge im subquadratischen Raum?

25

Der Schnittpunkt zweier (minimaler) DFAs mit n Zuständen kann unter Verwendung von O (n ² ) Zeit und Raum berechnet werden . Dies ist im Allgemeinen optimal, da der resultierende (minimale) DFA n ² Zustände haben kann. Wenn der resultierende minimale DFA jedoch z-Zustände hat, wobei z = O (n), kann er im Raum n ^2-eps für eine Konstante eps> 0 berechnet werden ? Ein solches Ergebnis würde mich auch für den Sonderfall interessieren, bei dem die Eingabe-DFAs azyklisch sind.

automata-theory dfa

— Rasmus Pagh
quelle

3

Ähm ... wenn zwei DFAs mit n Zuständen azyklisch sind, akzeptiert jeder nur eine endliche Menge von Wörtern mit einer Länge von höchstens n. In diesem Fall ist der Schnittpunkt nur der Schnittpunkt der beiden markierten Übergangsgraphen, die n Zustände und haben kann in linearer Zeit und Raum berechnet werden. Oder vermisse ich etwas?

— Joshua Grochow

4

Ja, azyklische DFAs akzeptieren nur eine begrenzte Anzahl von Wörtern. Es gibt jedoch Beispiele für azyklische DFAs, deren Schnittmenge die Größe n ^ 2 hat. Denken Sie beispielsweise an einen DFA, der Zeichenfolgen der Form AABC akzeptiert (wobei ABC Zeichenfolgen der Länge k sind), und an einen, der Zeichenfolgen der Form ABCC akzeptiert.

— Rasmus Pagh

1

retagging: cs.cc ist eine arxiv-Bezeichnung, daher benötigen die angegebenen Tags nicht das cs.cc-Präfix.

— Suresh Venkat

15

Die Antwort lautet Ja, ohne dass die Größe des Automaten geändert werden muss. Sie kann auch für DFAs, bei denen eine Konstante ist, im $O(\log^2 n)$ Raum berechnet werden. $k$ $k$

Let ( sein DFAs. Wir zeigen , daß, da , das Berechnen der minimalen DFA Erkennen kann durchgeführt werden in $A_i = (Q_i, \Sigma_i, \delta_i, z_i, F_i)$ $i \in [k])$ $k$ $\langle A_1, \ldots, A_k \rangle$ $\text{L}(A_1) \cap \cdots \cap\text{L}(A_k)$ Leerzeichen. Wir beweisen zunächst einige technische Ergebnisse. $O(\log^2 n)$

Definition 1 : Let zwei Zustände dann iff , $q, r$ $q \equiv r$ $\forall w \in \Sigma^*$ $q . w \in F \Leftrightarrow r . w \in F$

Wir betrachten nun den Automaten , der durch die klassische kartesische Produktkonstruktion gegeben ist. Lassen und Zustände von Be . $A$ $q = (q_1, \ldots, q_k)$ $r = (r_1, \ldots, r_k)$ $A$

Lemma 1 : Entscheiden, ob in NL ist. $q \equiv r$

Beweis (Skizze): Wir zeigen, dass die Testungleichwertigkeit in NL vorliegt und verwenden NL = coNL. Erraten ein Wort (ein Buchstabe zu der Zeit) , so dass ist ein Endzustand und ist nicht. Dies kann durch Berechnung von im log-Raum für und unter Verwendung der Tatsache, dass final ist, wenn $w \in \Sigma^*$ $q . w$ $r . w$ $q_i . w, r_i . w$ $i \in [k]$ $q$ . Es kann gezeigt werden, dass die Existenz eines mit impliziert. $q_i \in F_i \, \forall i \in [k]$ $q \not\equiv r$ $w$

Lemma 2 : Entscheiden, ob (in) zugänglich ist, ist in NL. $q$

Beweis (Skizze): Errate (Poly-Größe) Pfade von zu ( ). $z_i$ $q_i$ $i \in [k]$

Definition 2 : Betrachten Sie die Zustände von in lexikographischer Reihenfolge. Definieren Sie als den ersten zugänglichen Zustand und den ersten zugänglichen Zustand nach der keinem vorherigen Zustand entspricht. Wir definieren als das eindeutige so dass . $A$ $s(1)$ $s(i)$ $s(i-1)$ $c(q)$ $i$ $q \equiv s(i)$

Lemma 3 : kann im Raum berechnet werden. $s(i)$ $O(\log^2 n)$

Beweis (Skizze): Definition 2 liefert einen Algorithmus. Wir verwenden Zähler, um über die Zustände zu iterieren. Sei und der aktuelle Zustand. In jedem Zustand verwenden wir Lemma 2, um zu überprüfen, ob auf zugegriffen werden kann. Wenn dies der Fall ist, durchlaufen wir alle vorherigen Zustände und überprüfen, ob einer von ihnen . Wenn es keine gibt, erhöhen wir und geben wenn . Andernfalls speichern wir als und fahren fort. Da wir nur eine konstante Anzahl von Zählern speichern und unsere Tests in durchgeführt werden können $k$ $j \leftarrow 0$ $q$ $q$ $q$ $j$ $q$ $j = i$ $q$ $s(j)$ , hiermit ist der Beweis abgeschlossen. $\text{NL} \subseteq \text{DSPACE}(\log^2 n)$

Folgerung 1 : kann im Raum berechnet werden. $c(q)$ $O(\log^2 n)$

Theorem : Die Minimierung von kann im Raum . $A$ $O(\log^2 n)$

Beweis (Skizze): Sei sei das größte so dass definiert ist (dh die Anzahl der Klassen von ). Wir geben einen Algorithmus an, der einen Automaten ausgibt wobei $1 \leq m \leq |Q_0| \cdots |Q_1|$ $i$ $s(i)$ $\equiv$ $A' = (Q', \Sigma, \delta', z', F')$

; $Q' = \lbrace s(i) : i \in [m] \rbrace$
; $F' = \lbrace q \in Q' : q_i \in F_i \, \forall i \in [k] \rbrace$
wobei . $z' = s(c(q))$ $q = (z_0, \ldots, z_k)$

Wir zeigen nun, wie man berechnet . Für jedes , compute und Ausgang der Übergang . Nach Lemma 3 und Korollar 1 läuft dieser Algorithmus im Raum . Es kann überprüft werden, dass $\delta'$ $i \in [m], a \in \Sigma$ $q \leftarrow s(i) . a$ $\left(s(i), a, s(c(q))\right)$ $O(\log^2 n)$ $A'$ ist minimal und . $\text{L}(A') = \text{L}(A)$

— Michael Blondin
quelle

3

Netter Algorithmus! Hier ist eine etwas andere Sichtweise auf diesen Algorithmus. Der Kern besteht darin, dass die Zustandsminimierung eines beliebigen DFA in Polynomzeit und

-Raum durchgeführt werden kann. Danach ist es einfach, einen DFA zu konstruieren, der den Schnittpunkt im logarithmischen Raum darstellt (daher in Polynomzeit und

Raum

), und wir können zwei Funktionen zusammensetzen, die in Polynomzeit und

Raum

berechenbar sind (In ähnlicher Weise wie bei der Komposition zweier logarithmischer Raumreduktionen), wobei der gesamte Algorithmus in Polynomzeit und

O(log2n) $O(\log^2 n)$

Leerzeichen. O(log2n) $O(\log^2 n)$

— Tsuyoshi Ito

2

Ich habe gerade diese Antwort gesehen ... Ich verstehe nicht, warum der Algorithmus gleichzeitig in Polytime und

wird. Ja,

, aber es ist nicht bekannt, ob

- das heißt, wir können Wenn ein Algorithmus in polytime ausgeführt wird, können wir einen anderen Algorithmus ausführenO(log2n) $O(\log^2 n)$

NL⊆P∩DSPACE[log2n] $NL \subseteq P \cap DSPACE[\log^2 n]$

NL⊆TISP[nO(1),log2n] $NL \subseteq TISP[n^{O(1)}, \log^2 n]$

Raum, aber ich weiß nicht, wie ich

Probleme in polytime und

Raum mit einem einzigen Algorithmuslösenkann. O(log2n) $O(\log^2 n)$

NL $NL$

O(log2n) $O(\log^2 n)$

— Ryan Williams

Du hast recht, ich weiß auch nicht wie. Ich habe dies vor langer Zeit gepostet, daher bin ich mir nicht sicher, warum ich es so geschrieben habe, aber vielleicht meinte ich "Polynomial Time oder O (log² n)". Ich werde es bearbeiten, weil es irreführend ist. Vielen Dank!

— Michael Blondin

14

Dick Lipton und Kollegen haben kürzlich an diesem Problem gearbeitet, und Lipton hat hier darüber gebloggt:

http://rjlipton.wordpress.com/2009/08/17/on-the-intersection-of-finite-automata/

Es sieht so aus, als ob eine bessere Leistung als O (n ^ 2) auch für den ganz speziellen Fall offen ist, bei dem festgestellt wird, ob die DFA-Schnittmenge die leere Sprache definiert.
Der Aufsatz enthält Konsequenzen für die Komplexität, die sich aus einem stark verbesserten Algorithmus ergeben würden, der nicht nur 2 DFAs in der Schnittmenge, sondern auch größere Zahlen verarbeitet.

— Andy Drucker
quelle

1

und was ist mit Untergrenzen?

— Marcos Villagra

1

Nur um die Fragen zu klären: Ich verbringe gerne O (n ^ 2) Zeit (oder vielleicht sogar n ^ O (1) Zeit), um den gebundenen Raum zu verbessern.

— Rasmus Pagh

13

Wenn Sie k DFAs erhalten (k ist Teil der Eingabe) und wissen möchten, ob ihre Schnittmenge leer ist, ist dieses Problem im Allgemeinen PSPACE-vollständig:

Dexter Kozen: Untere Schranken für natürliche Beweissysteme FOCS 1977: 254-266

Wenn Sie diesen Beweis (und ähnliche Konstruktionen von Lipton und seinen Co-Autoren) sorgfältig studieren, finden Sie möglicherweise eine Art Raumuntergrenze, selbst für festes k.

— Ryan Williams
quelle

Danke für diesen Hinweis. Ich vermute, dass dies möglicherweise zu einem n ^ Omega (1) -Unterraum führen könnte, der abgesehen von der Eingabe für den zusätzlichen Speicherplatz erforderlich ist. Aber könnte es möglicherweise zu einer superlinearen Untergrenze des Raums führen?

— Rasmus Pagh

1

@ user124864 Bei

DFAs mit jeweils

Zuständen hat der Produktautomat

Zustände. Nun gibt es zwei Tricks, mit denen Sie die Größe reduzieren können. Das erste ist, dass Sie nur die erreichbare Komponente des Produktdiagramms berücksichtigen. Zweitens können Sie den Produkt-DFA minimieren. Letztendlich ist es schwierig herauszufinden, welche Sprache von diesem Produktautomaten erkannt wird. k $k$

n $n$

nk $n^k$

— Michael Wehar

1

@ user124864 Schon der Versuch, festzustellen, ob das Produkt DFA eine nicht leere Sprache erkennt, ist schwierig. Dies ist das Problem der Nicht-Leere an der Kreuzung. Mit schwer meine ich, dass es in einem starken Sinne

vollständig ist. XNL $XNL$

— Michael Wehar

1

@ user124864 Wenn Sie es in weniger als

Zeit lösen können , erhalten wir schnellere Algorithmen für PSPACE-vollständige Probleme. Es ist nicht lösbar in

nicht deterministischem Binärraum. Es ist nicht bekannt, ob wir es in weniger als

deterministischem Binärraum lösen können. Es ist nicht bekannt, ob wir es in simultaner deterministischer Polynomzeit und

binärem Raum für irgendeine Funktion lösen könnennk $n^k$

o(1)⋅k⋅log(n) $o(1) \cdot k \cdot \log(n)$

k2log2(n) $k^2 \log^2(n)$

f(k)⋅log2(n) $f(k) \cdot \log^2(n)$

(dies würde den Satz von Savitch verbessern). f $f$

— Michael Wehar

1

@ user124864 Hinweis: Wir haben beide der folgenden Möglichkeiten. (1) Beating

Zeit impliziert determinis schneller determinis Algorithmen für PSPACE vollständige Probleme und (2) Schlagen

Zeit impliziert nicht-deterministisch schneller nicht-deterministische Algorithmen für PSPACE vollständige Probleme. nk $n^k$

nk $n^k$

— Michael Wehar

7

Bei zwei Automaten , , die endliche Sprachen akzeptieren (azyklische Automaten), ist die Zustandskomplexität von in (1) . Dieses Ergebnis gilt auch für unäre DFAs (nicht unbedingt azyklisch) (2) . Sie scheinen jedoch über den Platz zu sprechen, der für die Berechnung der Schnittmenge zweier Automaten erforderlich ist. Ich verstehe nicht, wie die klassische Konstruktion mit dem kartesischen Produkt $A$ $B$ $L(A) \cap L(B)$ $\Theta(|A| \cdot |B|)$ $O(n^2)$ Platz. Sie benötigen lediglich eine konstante Anzahl von Zählern mit logarithmischer Größe. Wenn Sie die Übergangsfunktion für den neuen Status berechnen Sie nur die Eingabe scannen, ohne zuvor generierte Daten zu überprüfen. $(q,r)$

Vielleicht möchten Sie den Minimalautomaten ausgeben? Wenn dies der Fall ist, habe ich keine Ahnung, ob es erreicht werden kann. Die staatliche Komplexität der Schnittmenge für endliche Sprachen scheint nicht ermutigend. Unäre DFAs haben jedoch die gleiche Zustandskomplexität, und ich denke, dass dies mit solchen Automaten erreicht werden kann. Mit den Ergebnissen aus (2) können Sie die genaue Größe des Automaten ermitteln, der die Kreuzung erkennt. Diese Größe wird durch die Länge des Schwanzes und des Zyklus beschrieben, daher kann die Übergangsfunktion leicht mit sehr wenig Raum berechnet werden, da die Struktur vollständig durch diese beiden Größen beschrieben wird. Dann müssen Sie nur noch den Satz der Endzustände erzeugen. Sei die Anzahl der Zustände im resultierenden Automaten, dann für alle $n$ , Zustand ist ein Endzustand, wenn sowohl von als auch von akzeptiert wird. Dieser Test kann mit wenig Platz durchgeführt werden. $1 \leq i \leq n$ $i$ $a^i$ $A$ $B$

— Michael Blondin
quelle

1

Ja, ich interessiere mich für den Minimalautomaten oder zumindest für einen ähnlich großen Automaten. Vielen Dank für die Hinweise auf unäre DFAs. Dies scheint jedoch für den allgemeinen Fall nicht viel zu helfen.

— Rasmus Pagh