Wie kann man beweisen, dass eine Sprache nicht regelmäßig ist?

75

Wir haben etwas über die Klasse der regulären Sprachen gelernt . Es zeichnet sich durch ein beliebiges Konzept aus regulären Ausdrücken, endlichen Automaten und linkslinearen Grammatiken aus, sodass leicht gezeigt werden kann, dass eine bestimmte Sprache regulär ist. $\mathrm{REG}$

Wie zeige ich das Gegenteil? Mein TA hat darauf bestanden, dass wir dazu für alle regulären Ausdrücke (oder für alle endlichen Automaten oder für alle linkslinearen Grammatiken) nachweisen müssen, dass sie die jeweilige Sprache nicht beschreiben können. Das scheint eine große Aufgabe zu sein!

Ich habe etwas über pumpfähiges Lemma gelesen, aber es sieht wirklich kompliziert aus.

^{Hierbei handelt es sich um eine Referenzfrage, in der übliche Nachweismethoden und Anwendungsbeispiele gesammelt werden. Sehen Sie hier für die gleiche Frage auf kontextfreien Sprachen.}

— Raphael
quelle

60

Ein Widerspruchsbeweis wird häufig verwendet, um zu zeigen, dass eine Sprache nicht regulär ist: Lassen Sie eine Eigenschaft für alle regulären Sprachen gelten. Wenn Ihre spezifische Sprache nicht verifiziert , ist sie nicht regulär. Die folgenden Eigenschaften können verwendet werden: $P$ $P$

Das pumpfähige Lemma, wie in Daves Antwort veranschaulicht ;
Schließungseigenschaften regulärer Sprachen (Mengenoperationen, Verkettung, Kleene-Stern, Spiegel, Homomorphismen);
Eine reguläre Sprache hat eine endliche Anzahl von Präfixäquivalenzklassen, Myhill-Nerode-Theorem .

Um zu beweisen, dass eine Sprache Verwendung von Abschlusseigenschaften nicht regelmäßig ist, besteht die Technik darin, mit regulären Sprachen durch Operationen zu kombinieren , die die Regelmäßigkeit bewahren, um eine Sprache zu erhalten, die als nicht regelmäßig bekannt ist, z. B. die archetypische Sprache . Zum Beispiel sei . Angenommen, ist regulär, da reguläre Sprachen durch Komplementation geschlossen werden, ist Komplement $L$ $L$ $I= \{ a^n b^n | n \in \mathbb{N} \}$ $L= \{a^p b^q | p \neq q \}$ $L$ $L$ . Nehmenwirnun den Schnittpunkt von und der regulär ist. Wir erhalten der nicht regulär ist. $L^c$ $L^c$ $a^\star b^\star$ $I$

Der Myhill-Nerode-Satz kann verwendet werden, um zu beweisen, dass nicht regulär . Für ist . Alle Klassen sind unterschiedlich und es gibt unzählige solcher Klassen. Da eine reguläre Sprache eine begrenzte Anzahl von Klassen haben muss, bin nicht regulär. $I$ $p \geq 0$ $I/a^p= \{ a^{r}b^rb^p| r \in \mathbb{N} \}=I.\{b^p\}$ $I$

— Romuald
quelle

3

Ich wusste nichts über den Myhill-Nerode-Satz, cool!

— Daniil

Wikipedia hat auch einen Abschnitt über die Anzahl der Wörter in einer regulären Sprache: Wenn Sie nachweisen können, dass Ihre Sprache nicht mit der Charakterisierung übereinstimmt, dann ist Ihre Sprache nicht regulär: de.wikipedia.org/wiki/…

— Alex ten Brink

@Daniil, reguläre Ausdrücke können nicht zählen, scheint mir eine beliebte informelle Formulierung des Myhill-Nerode-Theorems zu sein.

— AProgrammer

@AlextenBrink: Das ist ordentlich. Ich vermute, die Konstanten in der Anweisung sind die Eigenwerte des Automaten Laplace? Dies wäre eine schöne Ergänzung zu den Antworten hier.

— Louis

@ Louis: Eigentlich haben wir für dieses Theorem überhaupt keine Referenz gefunden. Wenn Sie also mehr darüber wissen ... Siehe auch: cs.stackexchange.com/questions/1045/…

— Alex ten Brink

37

Basierend auf Daves Antwort finden Sie hier ein schrittweises "Handbuch" für die Verwendung des Pump-Lemmas.

Erinnern Sie sich an das pumpfähige Lemma (entnommen aus Daves Antwort aus Wikipedia):

Sei $L$ eine reguläre Sprache. Dann gibt es eine ganze Zahl $n\ge 1$ (nur in Abhängigkeit von $L$ ), so dass jede Kette $w$ in $L$ einer Länge von mindestens $n$ ( $n$ wird als "Pumplänge" bezeichnet) wie folgt geschrieben werden kann: $w = xyz$ (dh $w$ kann) in drei Teilzeichenfolgen unterteilt sein), die die folgenden Bedingungen erfüllen:

$|y| \ge 1$

$|xy| \le n$ und

a "gepumpt" $w$ ist noch in $L$ : für alle $i \ge 0$ , $xy^iz \in L$ .

Angenommen, Ihnen wird eine Sprache $L$ und Sie möchten zeigen, dass sie über das Pumplemma nicht regelmäßig ist. Der Beweis sieht so aus:

Angenommen, $L$ ist regelmäßig.
Wenn es regelmäßig ist, sagt das Pumplemma, dass eine Zahl $n$ die die Pumplänge ist.
Wählen Sie ein spezifisches Wort $w\in L$ der Länge größer ist als $n$ . Der schwierige Teil ist zu wissen, welches Wort zu nehmen ist.
Betrachten Sie ALLE Möglichkeiten, $w$ mit in 3 Teile zu unterteilen, $w=xyz$ und nicht leer. Zeigen Sie für jede dieser Möglichkeiten, dass sie nicht gepumpt werden kann: Es gibt immer einige so dass . $|xy|\le n$ $y$ $i\ge 0$ $xy^iz \notin L$
Fazit: Das Wort $w$ kann nicht "gepumpt" werden (egal wie wir es in $xyz$ aufteilen ), im Gegensatz zum Pumplemma, dh unsere Annahme (Schritt 1) ist falsch: $L$ ist nicht regulär.

Bevor wir zu einem Beispiel gehen, lassen Sie mich noch einmal Schritt 3 und Schritt 4 wiederholen (hier machen die meisten Leute Fehler). In Schritt 3 müssen Sie ein bestimmtes Wort in $L$ auswählen . schreibe es explizit auf, wie "00001111" oder " $a^nb^n$ ". Beispiele für Dinge, die kein bestimmtes Wort sind: " $w$ " oder "ein Wort, das 000 als Präfix hat".

Andererseits müssen Sie in Schritt 4 mehr als einen Fall berücksichtigen. Wenn beispielsweise $w=000111$ ist, reicht es nicht aus, $x=00, y=01, z=00$ zu sagen und dann einen Widerspruch zu erreichen. Sie müssen auch $x=0, y=0, z=0111$ und $x=\epsilon, y=000, z=111$ und alle anderen möglichen Optionen überprüfen .

Folgen wir nun den Schritten und beweisen Sie, dass $L= \{ 0^k1^{2k} \mid k>0 \}$ nicht regulär ist.

Angenommen, $L$ ist regelmäßig.
Sei $n$ die Pumplänge, die durch das Pumplemma gegeben ist.
Sei $w = 0^n 1^{2n}$ .
(Plausibilitätsprüfung: $|w|\gt n$ nach Bedarf. Warum dieses Wort? Andere Wörter können ebenfalls funktionieren. Es bedarf einiger Erfahrung, um das richtige $w$ ) Beachten Sie erneut, dass $w$ ein bestimmtes Wort ist: $\underbrace{000\ldots0}_{n \text{ times}}\underbrace{111\ldots1}_{2n \text{ times}}$ .
Betrachten wir nun die verschiedenen Fälle, um $w$ mit in $xyz$ aufzuteilen und . Seit egal wie wir teilen , besteht nur aus Nullen und . Nehmen wir an und . Wir müssen ALLE Optionen in Betracht ziehen, das sind alle möglichen $|xy|\le n$ $|y|>0$ $|xy|<n$ $w$ $x$ $y$ $|x|=s$ $|y|=k$ $s,k$ so dass $s\ge 0, k\ge 1$ und $s+k \le n$ . FÜR DIESES $L$ der Beweis für alle diese Fälle der gleiche, aber im Allgemeinen kann er unterschiedlich sein.
nimm $i=0$ und betrachte $xy^iz = xz$ . Dieses Wort ist NICHT in $L$ da es die Form $0^{n-k}1^{2n}$ (egal was $s$ und $k$ waren), und da $k \ge 1$ , ist dieses Wort nicht in $L$ und wir erreichen einen Widerspruch.
Daher ist unsere Annahme falsch und $L$ ist nicht regelmäßig.

Ein YouTube-Clip, in dem erklärt wird, wie man das pumpfähige Lemma in die gleiche Richtung verwendet, ist hier zu finden

— Ran G.
quelle

1

Es ist n, das die Pumplänge in dieser Definition ist!

— Saadtaame

28

Aus Wikipedia ist die Pumpensprache für reguläre Sprachen die folgende:

Sei eine reguläre Sprache. Dann existiert eine ganze Zahl (abhängig nur von ), so dass jede Kette in einer Länge von mindestens ( wird als "Pumplänge" bezeichnet) wie folgt geschrieben werden kann: (dh kann in drei Teilzeichenfolgen unterteilt sein), die die folgenden Bedingungen erfüllen: $L$ $p\ge 1$ $L$ $w$ $L$ $p$ $p$ $w = xyz$ $w$

$|y| \ge 1$

und $|xy| \le p$

für alle , . ist die Teilzeichenfolge, die gepumpt werden kann (entfernt oder beliebig oft wiederholt, und die resultierende Zeichenfolge ist immer in ). $i \ge 0$ $xy^iz \in L$
$y$ $L$

(1) bedeutet, dass die zu pumpende Schleife y mindestens eine Länge haben muss; (2) bedeutet, dass die Schleife innerhalb der ersten p Zeichen auftreten muss. Es gibt keine Einschränkung für x und z.

In einfachen Worten: Für jede reguläre Sprache L kann jedes ausreichend lange Wort in drei Teile geteilt werden. dh , so dass alle Zeichenketten für auch in . $w\in L$ $w = xyz$ $xy^kz$ $k\ge 0$ $L$

Betrachten wir nun ein Beispiel . Es sei . $L=\{(01)^n2^n\mid n\ge0\}$

Um zu zeigen, dass dies nicht regulär ist, müssen Sie überlegen, wie alle Zerlegungen aussehen, und wie alle möglichen Dinge x, y und z lauten, wenn (Wir sehen uns dieses spezielle Wort mit der Länge , wobei die Pumplänge ist.) Wir müssen uns überlegen, wo der Teil der Zeichenfolge vorkommt. Sie könnte sich mit dem ersten Teil überschneiden und ist daher entweder , $w=xyz$ $xyz=(01)^p2^p$ $3p$ $p$ $y$ $(01)^{k+1}$ , oder , für einige(vergessen Sie nicht, dass). Es könnte sich mit dem zweiten Teil überschneiden, was bedeutet, dass , für einige. Oder es könnte sich über die beiden Wortteile hinweg überschneiden und die Form , $(10)^{k+1}$ $1(01)^k$ $0(10)^k$ $k\ge 0$ $|y|\ge 1$ $y=2^k$ $k>0$ $(01)^{k+1} 2^l$ , oder fürund. $(10)^{k+1} 2^l$ $1(01)^k 2^l$ $0(10)^k 2^l$ $k\ge0$ $l\ge1$

Pumpen Sie nun jeden einzelnen, um einen Widerspruch zu erhalten, der ein Wort ist, das nicht in Ihrer Sprache vorkommt. Wenn wir zum Beispiel , sagt das Pumplemma zum Beispiel, dass in der sein muss Sprache, für eine entsprechende Auswahl von und . Dieses Wort kann jedoch nicht in der Sprache vorkommen, da eine vor einer . $y=0(10)^k2^l$ $xy^2z=x0(10)^k2^l0(10)^k2^lz$ $x$ $z$ $2$ $1$

Andere Fälle führen dazu, dass die Anzahl von größer ist als die Anzahl von oder umgekehrt, oder es entstehen Wörter, die beispielsweise nicht die Struktur haben Zwei hintereinander. $(01)$ $2$ $(01)^n2^n$ $0$

Vergessen Sie nicht , dass . Hier ist es sinnvoll , den Beweis zu verkürzen: viele der Zersetzungen oben sind unmöglich , weil sie das machen würde Teil zu lang. $|xy| \le p$ $z$

Jeder der oben genannten Fälle muss zu einem solchen Widerspruch führen, der dann ein Widerspruch zum Pumplemma wäre. Voila! Die Sprache wäre nicht regelmäßig.

— Dave Clarke
quelle

Ein Beispiel, in dem die Hypothese

wird benötigt wäre nett.

| x y | \leq p

$|xy|\le p$

— Gilles

@Gilles: Ich bin mir nicht mal sicher, was der von Ihnen hinzugefügte Satz bedeutet.

— Dave Clarke

@ Gilles: Ich denke, dass alle Zerlegungen möglich sind, nur dass

begrenzt sein wird. Ich bin mir nicht sicher, was es mit der Länge von

zu tun hat .

k

$k$

z

$z$

— Dave Clarke

Duh! Ich sehe es jetzt. Vielen Dank. Es schließt jedoch keine der in der Antwort genannten Zersetzungsformen aus; es begrenzt nur, welche Werte von

und

ich annehmen kann.

k

$k$

l

$l$

— Dave Clarke

1

Die Menge an Bearbeitung, die durchgeführt wurde, um eine so einfache Frage zu beantworten, lässt mich wundern, warum jeder das pumpfähige Lemma als "den" Weg lehrt, Unregelmäßigkeiten zu beweisen. Warum nimmst du aus Neugier nicht einfach deine Saite als

? Das pumpfähige Lemma sagt dir, dass

keine

s enthält, woraus sich ein Widerspruch ergibt.

(01)^{2 p} 2^{2 p}

$(01)^{2p}2^{2p}$

y

$y$

2

$2$

— Louis

14

Für eine gegebene Sprache , lassen $L \subseteq \Sigma^*$

$\qquad \displaystyle S_L(z) = \sum\limits_{n \geq 0} |L \cap \Sigma^n|\cdot z^n$

die (gewöhnliche) Erzeugungsfunktion von , dh ihre Folge von Wortzählungen pro Länge. $L$

Die folgende Anweisung lautet [ FlSe09 , p52]:

$\qquad \displaystyle L \in \mathrm{REG} \quad \Longrightarrow \quad S_L \text{ rational}$

Das heißt, mitPolynomen. $S_L(z) = \frac{P(z)}{Q(z)}$ $P,Q$

So ist jede Sprache, deren Erzeugungsfunktion nicht rational ist, nicht regulär. Leider haben alle linearen Sprachen auch rationale Generierungsfunktionen¹, sodass diese Methode für die einfacheren nicht regulären Sprachen nicht funktioniert. Ein weiterer Nachteil ist, dass es schwierig sein kann , (und zu zeigen, dass es nicht rational ist). $S_L$

Beispiel: Betrachten Sie die Sprache korrekt geschachtelter Wörter in Klammern, dh die Dyck-Sprache . Es wird durch die eindeutige Grammatik erzeugt

$\qquad \displaystyle S \to [S]S \mid \varepsilon$

was in die Gleichung übersetzt werden kann

$\qquad \displaystyle S(z) = z^2S^2(z) + 1$

eine Lösung (die mit allen positiven Koeffizienten) davon ist

. $\qquad \displaystyle \mathcal{S}(z) = \frac{1 - \sqrt{1 - 4z^2}}{2z^2}$

Da [ Kuic70 ] und nicht rational sind, ist die Dyck-Sprache nicht regulär. $S_L = \mathcal{S}$ $\mathcal{S}$

Der Beweis für die Aussage für reguläre Sprachen erfolgt über Grammatiken und wird sofort in lineare Grammatiken übertragen (Kommutativität der Multiplikation).

$\ \$ [FlSe09] Analytic Combinatorics von P. Flajolet und R. Sedgewick (2009) [Kuic70] Über die Entropie kontextfreier Sprachen von W. Kuich (1970)
$\ \$

— Raphael
quelle

13

Dies ist eine erweiterte Version meiner Antwort von hier Pumping Lemma Mit Sprache zu beweisen , ist nicht regulär $L = \{(01)^m 2^m \mid m \ge0\}$ , da es sich hierbei um eine Referenz Frage sein.

Sie denken also, das pumpfähige Lemma sieht kompliziert aus? Mach dir keine Sorgen. Hier ist ein etwas anderer Ansatz, der sich auch in der Antwort von @ Romuald verbirgt. (Quiz: wo?)

Beginnen wir damit, uns daran zu erinnern, dass jede reguläre Sprache von einem deterministischen Finite-State-Automaten (DFA) akzeptiert wird. Ein DFA ist ein endlich gerichteter Graph, bei dem jeder Scheitelpunkt genau eine Außenkante für jeden Buchstaben im Alphabet hat. Zeichenfolgen geben Ihnen einen Rundgang im Diagramm, der auf einem Scheitelpunkt mit der Bezeichnung "Start" basiert, und der DFA akzeptiert, wenn dieser Rundgang auf einem Scheitelpunkt mit der Bezeichnung "Akzeptieren" endet. (Die Eckpunkte werden "Zustände" genannt, weil verschiedene Bereiche der Mathematik gerne ihre eigene Terminologie für die gleiche Sache bilden.)

Mit dieser Denkweise ist es einfach , zu sehen , dass: Wenn Strings und die DFA in den gleichen Zustand fahren, dann für jede andere Zeichenfolge , und die DFA in den gleichen Zustand fahren. $a$ $b$ $c$ $ac$ $bc$ Warum? Denn der Ausgangspunkt eines Spaziergangs und die ihn definierende Schnur bestimmen das Ende vollständig.

Etwas anders ausgedrückt: Wenn regulär ist und die Zeichenfolgen und einen Erkennungsautomaten in denselben Zustand versetzen, dann sind für alle Zeichenfolgen entweder und beide in oder keine von beiden . $L$ $a$ $b$ $c$ $ac$ $bc$ $L$

Wir können dies verwenden, um zu zeigen, dass Sprachen nicht regelmäßig sind, indem wir sie uns vorstellen und dann und einführen, um einen DFA in den gleichen Zustand zu versetzen, und sodass in der Sprache ist und nicht. Die Beispielsprache entnehmen Sie bitte der Antwort von @ Dave. Stellen Sie sich vor, es ist regulär, sodass es einige anerkennende DFAs mit Zuständen gibt. Das Pigeon Hole-Prinzip besagt, dass mindestens zwei von den DFA in denselben Zustand versetzen, dh $a$ $b$ $c$ $ac$ $bc$ $m$ $\{(01)^i : 0\le i\le m+1\}$ und . Da , sehen wir, dass in der Sprache ist und nicht, so dass diese Sprache nicht regulär sein kann. $a=(01)^p$ $b=(01)^q$ $p\neq q$ $a2^p$ $b2^p$

Das Schöne ist, dass das Beispiel wirklich eine Vorlage ist, um zu beweisen, dass Sprachen nicht regelmäßig sind:

Finden Sie eine Familie von Zeichenfolgen mit der Eigenschaft, dass jede von ihnen einen "Schwanz" so dass in der Sprache und , weil nicht ist. $\{a_i :i\in\mathbb{N}\}$ $t_i$ $a_it_i$ $a_it_j$ $i\neq j$
Wende das obige Argument wörtlich an. (Dies ist zulässig, da es immer genug , um das Pigeon Hole-Prinzip aufzurufen.) $a_i$

Es gibt noch andere Tricks, aber dieser wird bei den meisten Ihrer Hausaufgaben problemlos funktionieren.

Bearbeiten: Eine frühere Version hatte einige Diskussion darüber, wie sich diese Idee auf das Pumping Lemma bezieht.

— Louis
quelle

Ich denke nicht, dass es allgemein nützlich ist, den Beweis von Pumping Lemma zu reproduzieren, sondern YMMV. Den Beweis zu verstehen ist auf jeden Fall gut; Es ist unmittelbar mit einer Reihe von Abschlüssen und anderen interessanten Eigenschaften endlicher Automaten und regulärer Sprachen verbunden. Ich stimme dem letzten Satz jedoch überhaupt nicht zu: Die Automatentheorie ist überhaupt nicht langweilig, und sie ist mit Sicherheit nicht der langweiligste Teil des Theorieunterrichts.

— Raphael

@ Louis In Ihrer Antwort, wie Sie mit dieser Aussage we see that a2p is in the language and b2p is not, so this language can't be regular.im letzten kommen. Bitte geben Sie ein Beispiel

— Himanshu

@Himanshu

und

bringen Sie beide in den gleichen Zustand

. Also, was auch immer Sie danach lesen (

a

$a$

b

$b$

q_{1}

$q_1$

hier), bringt Sie in den gleichen Zustand

, unabhängig davon, mit was Sie begonnen haben -

oder

.

2^{p}

$2^p$

q_{2}

$q_2$

a

$a$

b

$b$

— Al.G.

7

Im Anschluss an die Antwort hier , werde ich eine Methode zu beweisen , nicht-Regelmäßigkeit basierend auf Kolmogorv Komplexität beschreiben.

Dieser Ansatz wird in "Ein neuer Ansatz zur formalen Sprachtheorie durch Kolmogorov-Komplexität" von Ming Li und Paul MB Vitanyi diskutiert (siehe Abschnitt 3.1).

Lassen bezeichnen die Kolmogorov - Komplexität eines Strings , dh die Länge der kürzesten Codierung einer Turingmaschine , so dass (jedes der üblichen Definitionen tun wird). Man kann dann das folgende Lemma verwenden, um die Unregelmäßigkeit zu beweisen: $K(x)$ $x$ $M$ $M(\epsilon)=x$

KC-Gleichmäßigkeits : Let eine reguläre Sprache sein, so gibt es eine Konstante , die nur davon abhängt , , so dass für alle , Wenn ist die Zeichenfolge (bezogen auf die lexikographische Ordnung ) in $L\subseteq \Sigma^*$ $c$ $L$ $x\in\Sigma^*$ $y$ $n'th$ , dann $L_x=\left\{y\in \Sigma^*|xy\in L\right\}$ . $K(y)\le O(\log n)+c$

Man kann verstehen (und beweisen) , um die oben Lemma wie folgt für alle , die beschreiben Zeichenfolge in ein angeben muss: $x\in\Sigma^*$ $n'th$ $L_x$

Der Automat, der akzeptiert $L$
Der Zustand im Automaten nach der Verarbeitung des Präfixes $x$
Der Index $n$

Da wir uns nur den Zustand nach der Verarbeitung von merken müssen $x$ und nicht selbst, können wir diesen Faktor in Abhängigkeit von in der Konstanten ausblenden. Der Index benötigtzur Beschreibung Bits, und wir erhalten das obige Ergebnis (der Vollständigkeit halber muss man die spezifischen Anweisungen hinzufügen, die zur Erzeugung von erforderlich sind, aber dies fügt der endgültigen Beschreibung nur einen konstanten Faktor hinzu). $x$ $L$ $n$ $\log n$ $y$

Dieses Lemma zeigt, wie man die Kolmogorov-Komplexität aller Saiten, deren Mitglieder sind, begrenzt für einige reguläre Sprache und . UmUnregelmäßigkeitenzu zeigen, kann man annehmen, dass regulär ist, und beweisen, dass die Grenzen zu restriktiv sind (z. B. begrenzte Kolmogrov-Komplexität für eine unendliche Menge von Zeichenfolgen). $L_x$ $L$ $x\in\Sigma^*$ $L$

Die oben verlinkte Antwort enthält ein Beispiel für die Verwendung dieses Lemmas, um zu zeigen ist nicht regulär, einige weitere Beispiele finden Sie in der Arbeit. Der Vollständigkeit halber zeigen wir hier, wie man beweist $L=\left\{1^p | \text{p is prime}\right\}$ ist nicht regulär. $L=\left\{0^n1^n| n\ge 0\right\}$

Gegeben einige bezeichnen wir mit das Wort in . Man beachte, dass . Wenn wir das obige Lemma verwenden und uns auf die Präfixe der Form und , erhalten wir . Da $x\in\left\{0,1\right\}^*$ $y_i^x$ $i'th$ $L_x$ $y_1^{0^i}=1^i$ $x$ $x=0^i$ $n=1$ $\forall i\ge 0 : K(y_1^{0^i})\le c$ $y_1^{0^i}=1^i$ Dies bedeutet, dass wir die Kolmogorov-Komplexität aller Zeichenketten der Form durch eine Konstante begrenzen können , was offensichtlich falsch ist. Es ist erwähnenswert, dass wir ein einzelnes , z. B. für groß genug hätte untersuchen können , das $1^i$ $x$ $x=0^n$ $n$ (wir beginnen mit einem Präfix mit hoher Komplexität). Da , erhalten wir $K(0^n)\ge \log n$ $y_1^x=1^n$ , Widerspruch (nehme an, ). $K(1^n)<c$ $n>2^c$

— Ariel
quelle

7

Bei unären Sprachen (Sprachen über einem Alphabet der Größe 1) gibt es ein einfaches Kriterium. Lassen Sie uns ein Alphabet festlegen und für $\{ \sigma \}$ $A \subseteq \mathbb{N}$

L (A) = {σ^{n} : n \in A} .

$L(A) = \{ \sigma^n : n \in A \}.$

Satz. Lassen . Folgendes ist äquivalent: $A \subseteq \mathbb{N}$

ist regelmäßig. $L(A)$

ist kontextfrei. $L(A)$

Es gibt so dass für alle gilt, dass wenn $n_0,m \geq 1$ $n \geq n_0$ $n \in A$ $n+m \in A$ . (Wir sagen , dass ist schließlich periodisch .) $A$

Lassen Sie . Dann $a_i = 1_{i \in A}$ rational. $0.a_0a_1a_2\ldots$

Die Erzeugungsfunktion ist eine rationale Funktion. $\sum_{i \in A} x^i$

Der Satz kann auf viele Arten bewiesen werden, zum Beispiel mit dem Pump-Lemma, der Myhill-Nerode-Theorie, dem Satz von Parikh, der Struktur von DFAs auf unären Sprachen (sie sehen aus wie ein ", wie in Pollards Algorithmus) und so weiter . Hier ist eine nützliche Folgerung. $\rho$ $\rho$

Logische Folge. Sei und nehme an, dass regulär ist. $A \subseteq \mathbb{N}$ $L(A)$

Die Grenze existiert. (Dies ist dieasymptotische Dichtevon) $\rho = \lim_{n\to\infty} \frac{|A \cap \{1,\ldots,n\}|}{n}$ $A$

Ist so ist endlich. $\rho = 0$ $A$

Wenn dann cofinite ist (das heißt, endlich ist ). $\rho = 1$ $A$ $\overline{A}$

Zum Beispiel die Sprache nicht regulär, da die Menge eine verschwindende asymptotische Dichte hat und dennoch unendlich ist. $L(\{2^n : n \geq 0\})$

— Yuval Filmus
quelle

4

Die Klasse der regulären Sprachen wird durch verschiedene Abschlussoperationen geschlossen, z. B. Vereinigung, Schnittmenge, Komplement, Homomorphismus, reguläre Substitution, inverser Homomorphismus und mehr. Dies kann verwendet werden, um zu beweisen, dass eine bestimmte Sprache nicht regelmäßig ist, indem sie auf eine Sprache reduziert wird, von der bereits bekannt ist, dass sie nicht regelmäßig ist.

Nehmen wir als sehr einfaches Beispiel an, wir wissen, dass die Sprache $\{a^nb^n : n \geq 0\}$ nicht regulär ist. Dann können wir beweisen, dass die Sprache $\{w \in \{a,b\}^* : \#_a(w) = \#_b(w)\}$ (die Sprache aller Wörter mit gleich vielen $a$ s und $b$ s) wie folgt nicht regelmäßig ist:

Angenommen, $L = \{w \in \{a,b\}^* : \#_a(w) = \#_b(w)\}$ regulär. Dann wäre auch $L \cap a^*b^*$ regulär. Aber $L \cap a^*b^* = \{a^n b^n : n \geq 0\}$ , von dem bekannt ist, dass es nicht regelmäßig ist.

Hier ist ein komplizierteres Beispiel. Zeigen wir, dass die Sprache $L' = \{(0+1)^n2(0+1)^n : n \geq 0\}$ nicht regulär ist.

Sei $h$ die Homomorphismus-Abbildung, die gegeben ist durch $h(0) = 0$ , $h(1) = 1$ , $h(2) = \epsilon$ . Wenn $L'$ regelmäßige wurden dann würde so die folgende Sprache sein: $h(L' \cap 0^*21^*) = \{ 0^n 1^n : n \geq 0 \}$ . Wir wissen jedoch, dass Letzteres nicht regelmäßig ist.

Schließlich ist hier ein Beispiel mit inversem Homomorphismus. Zeigen wir, dass die Sprache $L'' = \{0^n10^n : n \geq 0\}$ nicht regulär ist.

Sei $k$ der Homomorphismus, gegeben durch $k(0) = 0$ , $k(1) = 0$ , $k(2) = 1$ . Wenn $L''$ regulär wäre, wäre es $k^{-1}(L'')$ , aber das ist nur die Sprache $L'$ aus dem vorhergehenden Beispiel.

— Yuval Filmus
quelle

3

Verwenden Sie die Myhill-Nerode-Theorie.

Lassen $L$ eine Sprache. Wir sagendaß zwei Worte $x,y$ sindinäquivalentenmodulo $L$ (oder: mit Bezug auf $L$ )wenn es ein Wort existiert $z$ , so dass genau eine von $xz,yz$ in ist $L$ . In jedem DFA für $L$ ist $\delta(q_0,x) \neq \delta(q_0,y)$ (Übung). Dies impliziert das folgende Kriterium:

Sei $L$ eine Sprache. Nehmen wir an, dass es eine unendliche Menge von paarweise inäquivalenten Worten besteht (das heißt, eine unendliche Menge $S$ , so daß irgendwelche zwei nicht gleich $x,y \in S$ sind inäquivalenten modulo $L$ ). Dann ist $L$ nicht regelmäßig.

Hier ist ein einfaches Beispiel für die Anwendung dieses Kriteriums:

Die Sprache $L = \{a^nb^n : n \geq 0\}$ ist nicht regulär.

Beweis. Sei $S = \{ a^n : n \geq 0 \}$ . Wir behaupten, dass zwei verschiedene Wörter in $S$ inequivalentes Modulo $L$ . In der Tat, lassen Sie $a^i,a^j \in S$ , wo $i \ne j$ . Dann $a^ib^i \in L$ aber $a^ib^j \notin L$ .

Ein wichtiges Merkmal dieser Methode ist, dass der Erfolg garantiert ist: Wenn $L$ nicht regulär ist, gibt es eine unendliche Menge paarweise ungleicher Wörter. Dies ist eine Konsequenz des Myhill-Nerode-Theorems . Kurz gesagt ist das Äquivalenzmodul $L$ (die oben definierte Negation des Unäquivalenzmoduls $L$ ) eine Äquivalenzbeziehung, und eine Sprache $L$ ist regelmäßig, wenn die Anzahl der Äquivalenzklassen des Äquivalenzmoduls $L$ endlich ist. Wenn $L$ nicht regulär ist, würde das Herausnehmen eines Wortes aus jeder Äquivalenzklasse eine unendliche Menge von nicht äquivalenten Wörtern darstellen.

— Yuval Filmus
quelle

1

Bei einer Sprache $L$ , für jede Saite $x$ gibt es eine Reihe von Strings $y$ , so daß $xy \in L$ . Jeder solche Satz könnte als ein Zustand in einer Zustandsmaschine verwendet werden.

Alles, was Sie tun müssen, ist zu zeigen, dass die Anzahl solcher Mengen nicht endlich ist.

Als Beispiel sei $L = {a^nb^n: n ≥ 0}$ . Wenn $x = a^nb$ für einige $n ≥ 1$ , ist die einzige Zeichenfolge $y$ so dass $xy \in L$ ist, $y = b^{n-1}$ . Also haben wir für jedes $n$ eine andere Menge, was bedeutet $L$ nicht regulär ist.

Wenn Sie also eine unendliche Menge von Strings $x$ , sodass jedes $x$ eine andere Menge $\{y: xy \in L\}$ ergibt, kann die Sprache im Allgemeinen nicht von einer Finite-State-Maschine erkannt werden und ist daher nicht regulär.

— gnasher729
quelle

Ist das nicht nur Myhill-Nerode?

— David Richerby