Ist die Sprache von Wortpaaren gleicher Länge, deren Hamming-Abstand 2 oder mehr beträgt, kontextfrei?

Ist der folgende Sprachkontext frei?

L = {u x v y ∣ u, v, x, y \in {0, 1}^{+}, | u | = | v |, u \neq v, | x | = | y |, x \neq y}

$L = \{ uxvy \mid u,v,x,y \in \{ 0,1 \}^+, |u| = |v|, u \neq v, |x| = |y|, x \neq y\}$

Wie von sdcvvc hervorgehoben, kann ein Wort in dieser Sprache auch als die Verkettung von zwei Wörtern gleicher Länge beschrieben werden, deren Hamming-Distanz 2 oder mehr beträgt.

Ich denke, es ist nicht kontextfrei, aber es fällt mir schwer, es zu beweisen. Ich habe versucht, diese Sprache mit einer regulären Sprache zu schneiden (wie zum Beispiel ), dann habe ich das Pumplemma und / oder die Homomorphismen verwendet, aber ich bekomme immer eine Sprache, die zu kompliziert ist, um sie zu charakterisieren und aufzuschreiben. $\ 0^*1^*0^*1^*$

— Robert777
quelle

Haben Sie versucht, die Zeichenfolge

pumpen

0^{u} 1^{x} 1^{u} 0^{x}

$0^u1^x1^u0^x$ ?

— Pål GD

Ja, aber ich habe es nicht geschafft, diese Zeichenfolge aus der Sprache zu entfernen (das bedeutet nicht, dass es nicht möglich ist, nur, dass ich es versäumt habe).

— Robert777

@ PålGD, du würdest wahrscheinlich eine Möglichkeit brauchen, die Teile zu "markieren", wie

1^{u} 0 1^{x} 0 1^{u} 0 1^{x} 0

$1^u 0 1^x 0 1^u 0 1^x 0$

— vonbrand

Diese Sprache kann geschrieben werden als

{u v : | u | = | v |, d (u, v) \geq 2}

$\{uv:|u|=|v|,d(u,v) \geq 2\}$ wobei

d

$d$ die Hamming-Distanz ist. Beachten Sie, dass wenn wir 2 durch 1 ersetzen, dies kontextfrei ist ( cs.stackexchange.com/questions/307 ), der dort verwendete Trick jedoch nicht funktioniert. Persönlich wette ich, dass es nicht kontextfrei ist.

— SDCVVC

@sdcvvc: Sie haben Recht, man partitioniert das

u

$u$ in

u^{'} x

$u'x$ so dass sich eines der unterschiedlichen Bits in

u^{'}

$u'$ und das andere in

x

$x$ . Ich stehe korrigiert.

— András Salamon

Antworten:

Hinweis [30.07.2019] Der Beweis ist falsch ... die Frage ist komplizierter als es klingt.

Nach einem gescheiterten Versuch hier ist es eine andere Idee.

Wenn wir schneiden $L$ mit dem regulären Sprache $L_{reg} = 0^*10^*10^*10^*$ wir eine CF Sprache erhalten.

Vielleicht können wir mehr Glück haben , wenn wir verwenden $L_{reg}' = 0^*10^*10^*10^*10^*$ (eine Zeichenkette mit genau 4 1s).

Let $L_1 = L \cap L_{reg}'$ , formlos $w \in L_1$ , wenn es in zwei Teile gespalten Hälften werden kann, so dass eine Hälfte genau enthält $\{0,1,3,4\}$ $1s$ oder beiden Hälften zwei enthalten $1$ s aber ihre Positionen stimmen nicht überein.

Angenommen, $L_1$ ist CF und sei $G$ seine Grammatik in Chomsky-Normalform, und sei

w = u v = 0^{a} 1 0^{b} 1 0^{c} 1 0^{d} 1 0^{e} \in L_{1}

$w = uv = 0^a 1 0^b 1 0^c 1 0^d 1 0^e \in L_1$

Wir haben $|u|=|v|$ (gerade Länge) und $d(u,v) \geq 2$

Wenn wir unsere Aufmerksamkeit auf die Art und Weise beschränken, in der die vier Einsen von $w$ erzeugt werden können, haben wir die drei oben in Abbildung 1 gezeigten Fälle. Der zentrale Teil von Abbildung 1 zeigt den ersten Fall (die anderen sind jedoch ähnlich). .

Bildbeschreibung hier eingeben
Abbildung 1 (das vollständige Bild kann hier heruntergeladen werden )

Wenn wir $a=e, c=2a$ und $b,d \gg a$ wählen sehen wir, dass die Nullen zwischen den beiden Einsenpaaren unabhängig voneinander pumpbar sein müssen (rote Knoten in der Abbildung): insbesondere für ausreichend große $b \gg a$ , Wir erhalten einen doppelten nicht-terminalen Knoten in einem internen Teilbaum (Knoten X in Abbildung 2) oder eine wiederholte Teilsequenz auf dem Weg zur ersten oder zweiten 1 (Knoten Y in Abbildung 2). Man beachte , dass 2 ein wenig vereinfacht: Es kann zwischen den zwei Nicht - Terminal - Knoten sein , $X$ s, und auch zwischen den beiden $Ys$ ( $Y\to ... \to Z_i \to ... Y$ aber mit $Z_i$ ergibt das nur 0s rechts von der ersten 1).

Bildbeschreibung hier eingeben
Figur 2

Wir können also ein willkürliches $a = e = k, c = 2a$ festlegen und dann ein ausreichend großes $b$ auswählen , um einen unabhängig pumpbaren Knoten in der Folge von Nullen zwischen der ersten und der zweiten $1$ . Für die Folge von Nullen zwischen der dritten und vierten 1 können wir $d = b! +b$ wählen .
Aber $0^b$ ist unabhängig pumpbar, so dass es einen $p \leq b$ pumpbaren Teilstring $y$ , dh so, dass $b = xyz, |y|=p, |x|\geq 0, |z|\geq 0$ und $xy^iz = b!+b$ . Die Zeichenfolge, die wir erhalten, ist:

w^{'} = 0^{k} 1 0^{b! + b} 1 0^{2 k} 1 0^{b! + b} 1 0^{k}

$w' = 0^k 1 0^{b!+b} 1 0^{2k} 1 0^{b!+b} 1 0^k$

aber $w' \notin L_1$ . Somit ist $L_1$ nicht CF und schließlich ist $L$ nicht CF.

Wenn der Beweis korrekt ist (???), kann er auf jede Sprache $L_k = \{ uv : |u|=|v|, d(u,v)\geq k\}, k\geq 2$

— Vor
quelle

Ich befürchte, dass das Kopfgeld verfällt, bevor wir diesen Beweis tatsächlich überprüfen können. Wenn also in den nächsten 4 Stunden keine drastischen Informationen auftauchen, sind dies die Punkte, die für den bislang besten Versuch sprechen.

— jmite

@jmite: Keine Sorge, es besteht die hohe Wahrscheinlichkeit, dass es sich um einen falschen Versuch handelt (der etwa 30 Minuten gedauert hat, bevor ein kleiner Fehler entdeckt wurde) :-) :-)

— Vor

Warum die Fallunterscheidung? Die Zweige in der Grammatik haben keine Beziehung zu den Worthälften. Aber ich denke, es spielt keine Rolle; Wenn der Beweis funktioniert, ist diese Fallunterscheidung nicht erforderlich. Eine angenommene Grammatik zu betrachten und den Beweis des Pumping-Lemmas anstelle des Lemmas selbst zu verwenden, ist ein netter Trick (man sollte dies öfter tun). Ich habe eine (echte) Sorge: Wenn Sie eine Teilzeichenfolge von

pumpen , erhalten Sie

; Ich verstehe nicht, wie du zu

kommst

. Denken Sie nicht, dass das dem Beweis schaden sollte, aber überprüfen Sie es besser. Vielleicht möchten Sie auch eine Notation (und Tippfehler) korrigieren.

0^{b}

$0^b$

0^{b + p (i - 1)}

$0^{b+p(i-1)}$

b + b!

$b+b!$

— Raphael

@Raphael: danke für die Kommentare. Vielleicht irre ich mich, aber wenn du als Ziellänge

dann für jede Pumplänge

, die Zeichenfolge

kann in zerlegt wird

und kann zu pumpen

in deinem Beispiel ist

sicher geteilt

b + b!

$b+b!$

p

$p$

0^{b}

$0^b$

0^{x y z}, (| x y z | = b, | y | = p \leq b)

$0^{xyz}, (|xyz|=b, |y|=p \leq b)$

x y^{i} z = b + b!

$xy^iz = b + b!$

b!

$b!$ es gibt also a

für die

, aber die ursprüngliche Stringlänge ist

, die Gesamtpumplänge ist also

. Ich erinnere mich an ein paar Übungen, die das Lemma des Ogden verwenden ... jetzt werde ich sie noch einmal überprüfen.

(i - 1)

$(i-1)$

p (i - 1) = b!

$p(i-1)=b!$

b

$b$

| x y^{(i - 1)} z | = b + b!

$|xy^{(i-1)}z| = b+b!$

— Vor dem

@Raphael: ... Ich habe nirgendwo einen Beweis gefunden, sondern nur eine Arbeit von Zach Tomaszewski, die beweist, dass die Ergänzung von

CF ist (siehe Frage ), also ist es vielleicht ein neues Ergebnis (wenn auch einfach); und ein Pump-Lemma-Stil-Theorem kann für Sprachen mit Zeichenfolgen abgeleitet werden, die eine endliche Anzahl eines bestimmten Symbols und Teilzeichenfolgen beliebiger Länge dazwischen enthalten.

L_{d u p} = {w w}

$L_{dup} = \{ ww \}$

— Vor dem

Nach 2 fehlgeschlagenen Versuchen, die von @Hendrik Jan abgelehnt wurden (danke), ist hier ein weiterer, der nicht erfolgreicher ist. @Vor hat ein Beispiel für eine deterministische CF-Sprache gefunden, bei der die gleiche Konstruktion angewendet würde, wenn sie korrekt wäre. Dies ermöglichte es, einen Fehler bei der Verankerung des Strings in der Anwendung des Lemmas zu identifizieren . Das Lemma selbst scheint nicht schuld zu sein. Dies ist eindeutig eine zu vereinfachende Konstruktion. Weitere Details finden Sie in den Kommentaren. $y$

Die Sprache ist nicht kontextfrei. $L = \{ uxvy \mid u,v,x,y \in \{ 0,1 \}^*\text \{ \epsilon \} \ ,\ \mid u \mid = \mid v \mid \ , \ u \not= v \ , \ \mid x \mid = \mid y \mid \ , \ x \not= y \ \}$

Es ist hilfreich, die Charakterisierung berücksichtigen wobei d die Hamming-Distanz ist, vorgeschlagen von @sdcvvc. Woran man denken muss, sind 2 ausgewählte Positionen in jeder halben Saite, so dass sich die entsprechenden Symbole unterscheiden. $L= \{uv:|u|=|v|,d(u,v) \geq 2\}$

Dann betrachten Sie eine Zeichenkette so, dass und gerade sind. Es ist eindeutig in der Sprache L, indem und irgendwo zwischen den beiden Einsen geschnitten werden. Wir wollen diese Zeichenkette im ersten Teil zwischen den Einsen pumpen, damit sie was nicht in der Sprache sein soll. $10^i10^j$ $i \lt j$ $i+j$ $u$ $x$ $10^j10^j$

Wir versuchen zunächst, Ogdens Lemma zu verwenden , das dem Pump-Lemma ähnelt, aber auf oder mehr auffällige Symbole angewendet wird , die in der Zeichenfolge markiert sind, wobei die Pumplänge für markierte Symbole ist (aber das Lemma kann mehr pumpen, weil es auch pumpen kann nicht markierte Symbole). Die Pumplänge hängt nur von der Sprache ab. Dieser Versuch wird fehlschlagen, aber der Fehler wird ein Hinweis sein. $p$ $p$ $p$

Wir können dann wählen und Symbole in der ersten Folge von 0 markieren . Wir wissen, dass keine der beiden Einsen in der Pumpe sein wird, weil sie einmal herauspumpen kann (Exponent 0), anstatt hinein zu pumpen. Und das Herauspumpen der Einsen würde uns aus der Sprache bringen. $i=p$ $i$

Wir könnten jedoch auf beiden Seiten der zweiten 1 genauso schnell oder sogar schneller auf der rechten Seite pumpen, so dass die zweite 1 niemals durch die Mitte der Saite gelangen würde. Auch Ogdens Lemma legt keine Obergrenze für die Größe des zu pumpenden Materials fest, so dass es nicht möglich ist, das Pumpen so zu organisieren, dass die genaueste 1 genau in der Mitte der Saite liegt.

Wir verwenden eine modifizierte Version des Lemmas, hier Nash's Lemma genannt, die diese Schwierigkeiten bewältigen kann.

Wir brauchen zuerst eine Definition (es hat wahrscheinlich einen anderen Namen in der Literatur, aber ich weiß nicht welche - Hilfe ist willkommen). Eine Zeichenkette wird als Löschen einer Zeichenkette wenn sie aus durch Löschen von Symbolen in . Wir werden beachten . $u$ $v$ $v$ $v$ $u \prec v$

Nashs Lemma: Wenn eine kontextfreie Sprache ist, gibt es zwei Zahlen und so dass für jede Zeichenfolge einer Länge von mindestens in und für jede Art, oder mehr der Zeichenfolgen zu „markieren“, gilt Positionen in , können wie geschrieben werden: mit der Zeichenfolge , , , , , so dass $L$ $p\gt0$ $q\gt 0$ $w$ $p$ $L$ $p$ $w$ $w$ $w=uxyzv$ $u$ $x$ $y$ $z$ $v$

hat mindestens eine markierte Position, $xz$
hat höchstens markierte Positionen und $xyz$ $p$
es gibt 3 Strings x , y , z derart , daß
1. ,,, $\hat x \prec x$ $\hat y \prec y$ $\hat z \prec z$
2. , , und $1 \leq \mid \hat x \hat z \mid \leq q$ $1 \leq \mid \hat y \mid \leq q$
3. ist in für jedes und für jedes . $ux^j\hat x^i\hat y\hat z^iz^jv$ $L$ $i \geq 0$ $j \geq 0$

Beweis : Ähnlich wie der Beweis von Ogdens Lemma, jedoch werden die Teilbäume, die den Zeichenfolgen und entsprechen, so beschnitten, dass sie keinen Pfad mit dem doppelten gleichen nicht-terminalen Wert enthalten (mit Ausnahme der Wurzeln dieser beiden Teilbäume). Dies notwendigerweise begrenzt die Größe der erzeugten Zeichenfolge und durch eine Konstante . Die Zeichenfolgen und für , die einer unbeschnittenen Version des Baums entsprechen, werden hauptsächlich mit $y$ $xz$ $\hat x\hat z$ $\hat y$ $q$ $x^j$ $z^j$ $j \geq 0$ $j=1$ Vereinfachung der Rechnungslegung bei Anwendung des Lemmas.

Wir ändern den obigen Beweis Versuch die Markierung ganz links Symbole 0, aber sie werden von gefolgt Symbole 0 , um sicherzustellen , dass wir im linken Teil des Strings, zwischen den beiden 1 der Pumpe. Dass insgesamt machen 0'en zwischen der 1'en (tatsächlich wäre ausreichend, da die am weitesten rechts liegenden 1 nicht sein kann , , die einfach zu entfernen erlauben würden). $p$ $2q$ $i = p + 2q$ $i = p + q$ $\hat z$

Was bleibt, ist gewählt zu haben, damit wir genau die richtige Anzahl von Nullen pumpen können, so dass die beiden Sequenzen gleich sind. Bisher besteht die einzige Einschränkung für darin, größer als . Und wir wissen auch, dass die Anzahl der Nullen, die bei jedem Pumpen gepumpt werden, zwischen 1 und q liegt. Also sei Produkt der ersten ganzen Zahlen. Wir wählen . $j$ $j$ $i$ $h$ $q$ $j=i+h$

Da das Pumpinkrement - was auch immer es ist - in , teilt es . Sei der Quotient. Wenn wir genau mal pumpen , erhalten wir einen String der nicht in der Sprache ist. Daher ist L nicht kontextfrei. $d$ $[1,q]$ $h$ $k$ $k$ $10^j10^j$

Ich denke, ich werde niemals
eine Schnur sehen, die so schön ist wie ein Baum.
Wenn es keine Syntaxanalyse gibt, ist
die Zeichenfolge nichts anderes als eine Farce

— babou
quelle

Beachten Sie jedoch, dass der Durchlauf über die zweite Hälfte den Stapel in umgekehrter Reihenfolge liest. Das scheint zu bedeuten, dass die beiden Positionen in beiden Hälften in der gleichen Position sind, aber umgekehrt?

— Hendrik Jan

du hast recht ... ich habe gepatzt ... jetzt weiß ich, was mich am Hinterkopf gequält hat.

— Babou

Ich erkannte das Argument (weil ich es nicht zum Laufen bringen konnte, als ich es selbst versuchte).

— Hendrik Jan

Soll ich diese falsche Antwort hinterlassen? Es ist irgendwie hilfreich, denke ich, da es das Problem verdächtig ähnlich macht wie

. Das Problem ist, dass die Regeln der Website nicht dazu führen sollen, dass falsche Ergebnisse zur Diskussion gestellt werden (ich meine, ich mag Downvotes nicht mehr als jeder andere).

a^{i} b^{j} c^{k} a^{i} b^{j} c^{k}

${a^ib^jc^ka^ib^jc^k}$

— Babou

@HendrikJan Hab ich nochmal gepatzt? (Übrigens, danke für die Diskussion)

— babou

-1

Durch diese Frage denke ich, dass kontextfrei ist und durch die folgende Grammatik erzeugt wird $L$ $\qquad\begin{align} S &\to AXBY \mid BYAX \\ A &\to 0 \mid 0A0 \mid 0A1 \mid 1A0 \mid 1A1 \\ B &\to 1 \mid 0B0 \mid 0B1 \mid 1B0 \mid 1B1 \\ X &\to 0 \mid 0X0 \mid 0X1 \mid 1X0 \mid 1X1 \\ Y &\to 1 \mid 0Y0 \mid 0Y1 \mid 1Y0 \mid 1Y1 \\ \end{align}$

— MK Dadsetani
quelle

Das ist falsch; Sie können nicht schützen, dass die Länge von AX der Länge von BY entspricht. Beispielsweise generiert Ihre Grammatik S -> AXBY -> A011 -> 0A1011 -> 001011, das nicht in der Originalsprache vorliegt. Außerdem erzeugen Ihre Symbole A und X dieselbe Sprache wie B und Y; Sie können zusammengelegt werden.

— SDCVVC