1) Wenn wir auch Schnittmenge und Komplement zulassen, werden die resultierenden Ausdrücke manchmal als erweiterte reguläre Ausdrücke bezeichnet;; Da die regulären Sprachen unter booleschen Operationen geschlossen sind, wird durch sie nichts gewonnen. Es ist nur syntaktischer Zucker. Eine ähnliche Schlussfolgerung gilt für die umgekehrte Operation. Ein Grund dafür, dass in erster Linie alle anderen Operationen nicht erwähnt werden, ist das Ziel, die Definition so einfach wie möglich zu halten, damit (induktive) Beweise nicht in vielen Fällen erledigt werden müssen. Eine andere Ursache könnte sein, dass, wenn wir bestimmte Operationen zulassen, andere jedoch nicht, in einigen Fällen sehr unterschiedliche (unregelmäßige) Sprachklassen resultieren, z. B. wenn wir einen erweiterten regulären Ausdruck ohne den Sternoperator betrachten, wir eine richtige Unterklasse der regulären erhalten , die sogenannten sternfreien oder aperiodischen Sprachen, siehe Wikipedia: sternfreie Sprache .
2) Wenn wir die Punkte 1. - 6. beibehalten, aber Punkt 4. ändern, indem wir anstelle der Vereinigung die Schnittmenge verwenden, erhalten wir eine richtige Unterklasse der regulären Sprachen. Zum Beispiel könnten wir die Sprache nicht mehr beschreiben , da dies die Vereinigung von { a } und { b } beinhalten würde (siehe Beweis unten). Wenn wir eine Ergänzung zulassen, ändern sich die Dinge, da wir durch die Gesetze von DeMorgan wieder eine Vereinigung haben.L={a,b}{a}{b}
3) Dies wurde teilweise von mir in 1) beantwortet, aber was meinst du, wenn du sagst, dass diese Definition bevorzugt wird? Ich kenne Definitionen, bei denen 2. weggelassen wird (wie wir bis 6. haben, dass ), oder 3. weggelassen wird (wie wir ∅ = L ( ¯ X ∗ ) haben), oder beide weggelassen werden ;; Dies ist also nicht die minimal mögliche Definition (sie gibt uns auch etwas syntaktischen Zucker, da wir zusätzliche Symbole haben, um { ε } und ∅ zu beschreiben ).L(∅∗)={ε}∅=L(X∗¯¯¯¯¯¯¯{ε}∅
EDIT : Mein erster erwähnten Kommentar in 2) falsch waren, Sprachen in der induktiven Schließung unter , * und ∩ nicht neccessarily sind Teilmengen von x * für einig x ∈ X , zum Beispiel betrachten L ( a ∘ b ) = { ein b } . Trotzdem haben wir, dass L = { a , b } durch einen solchen Ausdruck nicht beschrieben werden kann. Ich werde einen Beweis geben, nämlich ich beweise, dass wenn L = L ( R )∘∗∩x∗x∈XL(a∘b)={ab}L={a,b}L=L(R)für einigen Ausdruck mit dem vierten Elemente geändert, dann , wenn (und somit einem ≠ b )
{ a , b } ⊆ L ⇒ a b ∈ L .
Der Beweis , geht durch Induktion der Expression R . Für den Basisfall gilt es vakuum, nun sei angenommen, es gilt für L ( R 1 ) , L ( R 2 ) . Wenn L = L ( R 1 R.X={a,b}a≠b
{a,b}⊆L⇒ab∈L.
RL(R1),L(R2) und
{ a , b } ⊆ L , dann
{ a , b } ⊆ L ( R i ) , i = 1 , 2, daher haben wir nach Induktionshypothese
a b ∈ L ( R 1 ) ∩ L ( R 2 ) . Wenn
L=L(R1∩R2)=L(R1)∩L(R2){a,b}⊆L{a,b}⊆L(Ri),i=1,2ab∈L(R1)∩L(R2) dannmüssen wirals
a = a ⋅ ε = ε ⋅ a a ∈ L ( R 1 ) und
ε ∈ L haben ( R 2 ) oder umgekehrt. Angenommen, der erste Fall. Wenn
b ∈ L ({a,b}⊆L(R1∘R2)=L(R1)L(R2)a=a⋅ε=ε⋅aa∈L(R1)ε∈L(R2) , dann
b∈L(R1)ab∈L(R1)ab=ab⋅ε∈L(R1)L(R2). Now suppose
b∈L(R2), then we have
a⋅b∈L(R2)L(R2) by definition of
L(R1)L(R2)a,b∈L(R∗1)a∈L(R1)nb∈L(R2)mn,m>0. If
n=m=1 we find
ab∈L(R1) by induction hypothesis, so suppose
n>1, but this gives
a∈L(R1), similar either
m=1 or
m>1 gives
b∈L(R1) and the induction hypothesis gives
ab∈L(R1)⊆L(R∗1).
□
Remark: One commonly used conclusion: If a=uw, then u=a or w=a. This follows as 1=|a|=|uw|=|u|+|w|, hence |u|=0 and |w|=1 or |u|=1 and |w|=0. In the first case we have u=ε and hence a=w.