Im Anschluss an die Antwort hier , werde ich eine Methode zu beweisen , nicht-Regelmäßigkeit basierend auf Kolmogorv Komplexität beschreiben.
Dieser Ansatz wird in "Ein neuer Ansatz zur formalen Sprachtheorie durch Kolmogorov-Komplexität" von Ming Li und Paul MB Vitanyi diskutiert (siehe Abschnitt 3.1).
Lassen bezeichnen die Kolmogorov - Komplexität eines Strings x , dh die Länge der kürzesten Codierung einer Turingmaschine M , so dass M ( ε ) = x (jedes der üblichen Definitionen tun wird). Man kann dann das folgende Lemma verwenden, um die Unregelmäßigkeit zu beweisen:K(x)xMM(ϵ)=x
KC-Gleichmäßigkeits : Let eine reguläre Sprache sein, so gibt es eine Konstante c , die nur davon abhängt , L , so dass für alle x & egr ; & Sgr; * , Wenn y ist die n ' t h Zeichenfolge (bezogen auf die lexikographische Ordnung ) in L x = { y ∈L⊆Σ∗cLx∈Σ∗yn′th , dannK(y)≤O(logn)Lx={y∈Σ∗|xy∈L} .K(y)≤O(logn)+c
Man kann verstehen (und beweisen) , um die oben Lemma wie folgt für alle , die beschreiben n ' t h Zeichenfolge in L x ein angeben muss:x∈Σ∗n′thLx
- Der Automat, der L akzeptiertL
- Der Zustand im Automaten nach der Verarbeitung des Präfixes x
- Der Index n
Da wir uns nur den Zustand nach der Verarbeitung von x merken müssenx und nicht selbst, können wir diesen Faktor in Abhängigkeit von L in der Konstanten ausblenden. Der Index n benötigtzur Beschreibung log n Bits, und wir erhalten das obige Ergebnis (der Vollständigkeit halber muss man die spezifischen Anweisungen hinzufügen, die zur Erzeugung von y erforderlich sind, aber dies fügt der endgültigen Beschreibung nur einen konstanten Faktor hinzu).xLnlogny
Dieses Lemma zeigt, wie man die Kolmogorov-Komplexität aller Saiten, deren Mitglieder sind, begrenzt für einige reguläre Sprache L und x & egr ; & Sgr; * . UmUnregelmäßigkeitenzu zeigen, kann man annehmen, dass L regulär ist, und beweisen, dass die Grenzen zu restriktiv sind (z. B. begrenzte Kolmogrov-Komplexität für eine unendliche Menge von Zeichenfolgen).LxLx∈Σ∗L
Die oben verlinkte Antwort enthält ein Beispiel für die Verwendung dieses Lemmas, um zu zeigen p is prime } ist nicht regulär, einige weitere Beispiele finden Sie in der Arbeit. Der Vollständigkeit halber zeigen wir hier, wie man beweistL={1p|p is prime} ist nicht regulär.L={0n1n|n≥0}
Gegeben einige bezeichnen wir mit y x i das i ' t h Wort in L x . Man beachte, dass y 0 i 1 = 1 i . Wenn wir das obige Lemma verwenden und uns auf die Präfixe x der Form x = 0 i und n = 1 konzentrieren , erhalten wir ) ≤ c . Da y 0 i 1 = 1x∈{0,1}∗yxii′thLxy0i1=1ixx=0in=1∀i≥0:K(y0i1)≤cy0i1=1iDies bedeutet, dass wir die Kolmogorov-Komplexität aller Zeichenketten der Form durch eine Konstante begrenzen können , was offensichtlich falsch ist. Es ist erwähnenswert, dass wir ein einzelnes x , z. B. x = 0 n, für groß genug n hätte untersuchen können , das K ( 0 n ) ≥ log1ixx=0nn(wir beginnen mit einem Präfix mit hoher Komplexität). Da y x 1 = 1 n ist , erhalten wirK(0n)≥lognyx1=1n , Widerspruch (nehme an, n > 2 c ).K(1n)<cn>2c