Wörter mit zufälligen DFAs trennen

Eines der interessanten offenen Probleme mit DFAs, die in aufgeführt sind. Gibt es noch offene Probleme mit DFAs? ist die Größe eines DFA, die zum Trennen von zwei Zeichenfolgen der Länge erforderlich ist . Ich bin neugierig, ob es irgendwelche Ergebnisse über die Fähigkeit eines zufälligen DFA gibt, zwei gegebene (nicht zufällige) Zeichenfolgen zu trennen. $n$

Offensichtlich trennt ein zufälliger DFA mit ausreichend vielen Zuständen Zeichenfolgen mit hoher Wahrscheinlichkeit. Insbesondere wenn , ist es unwahrscheinlich , dass ein zufälliger DFA mit -Zuständen jemals denselben Zustand erneut besucht, sobald er den ersten Ort erreicht, an dem und unterschiedlich sind, und trennt daher und . $u,v \in \Sigma^n$ $O(n)$ $u$ $v$ $u$ $v$

Können wir es besser machen? Im Idealfall, was die kleinsten st , dass ein zufälliges DFA mit Zuständen trennen Strings der Länge mit positiver Wahrscheinlichkeit (oder vielleicht Wahrscheinlichkeit )? Eine kurze Suche ergab nicht viele Ergebnisse zu den Eigenschaften zufälliger DFAs. Ich konnte nur http://arxiv.org/abs/1311.6830 finden . $f(n)$ $f(n)$ $n$ $\ge 1/2$

dfa random-graphs

— Geoffrey Irving
quelle

Positive Wahrscheinlichkeit ist hier keine besonders nützliche Bedingung, da es sich nur um eine Wiederholung des offenen Problems handelt. Hohe Wahrscheinlichkeit könnte noch interessant sein.

— Geoffrey Irving

Was bedeutet "trennt"? Akzeptiert das eine und lehnt das andere ab? Wenn ja, ist es offensichtlich, dass

-Zustände ausreichen?

O (n)

$O(n)$

— usul

Ja, sondern Mittel akzeptiert genau einen. Und Sie haben Recht: Das trivialste Trennungsargument erfordert tatsächlich

O (n^{2})

$O(n^2)$ -Zustände (was ich oben geschrieben habe, ist falsch), obwohl ich überrascht wäre, wenn viele weniger nicht ausreichen würden.

— Geoffrey Irving

Würden Sie nicht erwarten, dass die Grenzen davon abhängen, wie sehr sich die Wörter unterscheiden? Es scheint, als wären Wörter, die sich durch einen einzelnen Buchstaben unterscheiden, schwerer zufällig zu unterscheiden, da Sie an diesem einen Übergang unterscheiden müssen, und sehr unterschiedliche Wörter wären einfacher. [Um es zu verallgemeinern, Sie können das längste gemeinsame Präfix vergessen (Sie erreichen daraus einen zufälligen Zustand); Unterschiedliche Buchstaben senden Sie dann entweder in den gleichen oder in verschiedene Bundesstaaten. dann, wenn die Zustände unterschiedlich sind, müssen Sie sich die Probe der Resynchronisation ansehen und synchron bleiben (beginnt wieder abhängig von den Worten) ...]

— a3nm

Ja, wie das offene Problem, ich interessiere mich für die am schwersten zu unterscheidenden Wörter. Wörter, die sich nur an wenigen Stellen unterscheiden, können bereits durch

-Zustände getrennt werden, so dass es unwahrscheinlich ist, dass dies der Fall ist.

O (\log n)

$O(\log n)$

— Geoffrey Irving

[Bearbeiten: Diese Antwort funktioniert nicht, siehe Kommentare.]

Dies ist nur eine informelle Idee und ich weiß nicht, ob es hilft, aber es ist zu lang, um als Kommentar gegeben zu werden. Außerdem kenne ich mich mit zufälligen DFAs überhaupt nicht aus. Vielleicht habe ich eine falsche Vorstellung davon, wie Sie mit Wahrscheinlichkeiten darüber argumentieren sollten, aber hoffentlich ist dies nicht ganz wertlos.

Ich gehe davon aus, dass Ihre Grenzen davon abhängen sollten, wie sehr sich und unterscheiden. Wenn dies nicht der Fall ist, scheint mir klar zu sein, dass sich die Zeichenfolgen im schlimmsten Fall nur durch das erste Zeichen unterscheiden (Zeichenfolgen, die sich an einer Reihe von Positionen unterscheiden, haben mehr Chancen, voneinander getrennt zu werden als Zeichenfolgen, die sich an einer Reihe unterscheiden) $u$ $v$ $X$ Positionen unterscheiden) Ich würde sagen, und wenn Sie den Unterschied so früh wie möglich setzen, haben Sie die Möglichkeit, ihn erneut zu synchronisieren. $Y \subset X$

Ich werde auch die Wahrscheinlichkeit untersuchen, dass die Wörter unterschieden werden, nämlich unterschiedliche Zustände erreichen. Ich denke, Sie müssten sich dann darauf einstellen, ob Sie akzeptiert oder abgelehnt werden, je nachdem, wie Ihre zufälligen DFAs die Endzustände zuweisen. Wenn jeder Zustand eine halbe Wahrscheinlichkeit hat, endgültig zu sein, werden die Saiten nicht unterschieden, wenn sie in demselben Zustand enden, und wenn sie in verschiedenen Zuständen enden, haben sie eine halbe Wahrscheinlichkeit, unterschieden zu werden.

Nun betrachte ich das Wort das aus und wie folgt: wenn und andernfalls. Ich denke, es ist klar, dass das einzig Interessante an und . $w$ $u$ $v$ $w_i = 1$ $u_i = v_i$ $w_i = 0$ $w$ $u$ $v$

Definieren Sie nun die Wahrscheinlichkeit, dass wir nach dem Lesen von Präfixen der Länge von und im selben Zustand sind , und $p(i)$ $i$ $u$ $v$ die Wahrscheinlichkeit, dass wir nichtsind. $q(i) = 1 - p(i)$

Ich denke wir haben , wenn ist . Intuitiv befinden wir uns nach dem Lesen von Buchstaben im selben Zustand, entweder als wir uns nach dem Lesen von im selben Zustand befanden, oder als wir uns in zwei verschiedenen (zufälligen) Zuständen befanden, zeichneten wir zwei Übergänge in zufällige Zustände und sie passierten sei der gleiche. Ebenso haben wir $p(i+1) = p(i) + q(i)/n$ $w_{i+1}$ $1$ $i+1$ $i$ , wenn ist : Sie zeichnen zwei zufällige Zustände, unabhängig davonwo Sie begonnen. $p(i+1) = 1/n$ $w_{i+1}$ $0$

Daraus könnte man die Wahrscheinlichkeit berechnen, dass man sich nach dem Lesen von und im selben Zustand befindet . $u$ $v$

— a3nm
quelle

Leider ist es alles

als offensichtlich, dass

die einzige interessante Eigenschaft von

und

. Der einfachste Weg, dies zu erkennen, besteht darin, dass es trivialerweise eine Wahrscheinlichkeit ungleich Null gibt, ein nichttriviales

w

$w$

u

$u$

v

$v$

w

$w$ von

; in der Tat genügen nur zwei Zustände, unabhängig von

. Wie in arxiv.org/pdf/1103.4513.pdf erläutert , gibt es jedoch Wörter

der Länge

st no

die DFA unterscheiden kann. Dies widerspricht Ihren Formeln für

0^{n}

$0^n$

n

$n$

u, v

$u,v$

n

$n$

o (\log n)

$o(\log n)$

p (i)

$p(i)$ .

— Geoffrey Irving

Zur Verdeutlichung wären Ihre Formeln korrekt, wenn die DFA-Übergänge eine zufällige Funktion des Zeichenfolgenindex wären. da sie indexunabhängig sind, sind die wahrscheinlichkeiten ziemlich kompliziert korreliert.

— Geoffrey Irving

Ich fürchte, ich verstehe Ihr Gegenbeispiel nicht. Es gibt ein

prba mit zwei Zuständen, um

unterscheiden

> 0

$>0$

und

, OK; und vielleicht gibt es Wörter der Länge

, die mit

-Zuständen nicht auseinandergehalten werden können. Aber wie widerspricht es meiner Behauptung, dass

das einzig Wichtige ist, oder meinen Formeln für

0^{n}

$0^n$

w \neq 0^{n}

$w \neq 0^n$

n

$n$

o (\log n)

$o(\log n)$

w

$w$

p (i)

$p(i)$ ? Bezüglich der Korrelationen sehe ich, dass es einen Haken der Art gibt, die Sie erwähnen, aber ich verstehe noch nicht, warum er genau fehlschlägt. Wenn Sie denselben Zustand zweimal durchlaufen, gibt es eine Korrelation, aber gibt es einen Grund zu der Annahme, dass er sich im Durchschnitt in eine bestimmte Richtung auswirkt?

— Am

Wenn

, werden

und

mit positiver Wahrscheinlichkeit unterschieden. Für ausreichend große

und kleine Anzahlen von Zuständen wissen wir jedoch, dass

für einige

p (n) < 1

$p(n) < 1$

u

$u$

v

$v$

n

$n$

p (n) = 1

$p(n) = 1$

u

$u$ und

. Da Ihre Formeln implizieren, dass wenn

dann

v

$v$

p (i) < 1

$p(i) < 1$

, Ihre Formel erfasst nicht die Tatsache, dass bestimmte

und

nicht zu unterscheiden sind.

p (i + 1) = p (i) + (1 - p (i)) / n = p (i) (1 - 1 / n) + 1 / n < 1

$p(i+1) = p(i) + (1-p(i))/n = p(i)(1-1/n)+1/n < 1$

u

$u$

v

$v$

— Geoffrey Irving

Ah ... richtig, ich verstehe. Wenn kein kleiner DFA zwei Wörter unterscheiden kann, kann auch kein zufälliger DFA sie unterscheiden. In der Tat gibt es ein Problem mit meinem Ansatz, die Wahrscheinlichkeit

sollte schließlich aufgrund dieser Korrelationen auf Null fallen, wie es scheint. Entschuldigung für die falsche Antwort.

q (i)

$q(i)$

— 15:00