Ich versuche eine Rechtschreibprüfung zu schreiben, die mit einem ziemlich großen Wörterbuch funktionieren sollte. Ich möchte wirklich, dass meine Wörterbuchdaten auf effiziente Weise indexiert werden, um anhand einer Damerau-Levenshtein- Distanz zu bestimmen, welche Wörter dem falsch geschriebenen Wort am nächsten kommen. Ich suche eine Datenstruktur, die mir den besten Kompromiss …
, und sind zwei Zeichenfolgen gleicher Länge. Eine Darstellung von zwei Zeichenfolgen ist eine bijektive Abbildung von so dass für jedes .b 1 b 2 … b na1a2…ana1a2…ana_1a_2\ldots a_nb1b2…bnb1b2…bnb_1b_2\ldots b_na i = b p ( i ) ip:[1…n]→[1…n]p:[1…n]→[1…n]p:[1\ldots n]\to[1\ldots n]ai=bp(i)ai=bp(i)a_i = b_{p(i)}iii Es kann mehr als ein Diagramm für dasselbe …
Ich suche nach einer Datenstruktur , dass speichert einen Satz von Saiten über einen Zeichensatz , können die folgenden Operationen durchführen. Wir bezeichnen D ( S ) als die Datenstruktur, die den Satz von Zeichenketten S speichert .ΣΣ\SigmaD(S)D(S)\mathcal{D}(S)SSS Add-Prefix-Seton : Bei gegebener Menge T von (möglicherweise leeren) Zeichenfolgen, deren Größe …
Informelle Problemstellung: Bei einer gegebenen Zeichenfolge, z. B. , möchten wir einige Buchstaben rot und einige Buchstaben blau (und einige überhaupt nicht) färben, sodass das Lesen nur der roten Buchstaben von links nach rechts dasselbe Ergebnis ergibt wie das Lesen nur der blauen Buchstaben.ACCABBABACCABBABACCABBAB Im Beispiel könnten wir sie folgendermaßen …
Ich suche nach einer Datenstruktur, die eine effiziente ungefähre Suche nach Schlüsseln unterstützt (z. B. Levenshtein-Abstand für Zeichenfolgen), wobei die bestmögliche Übereinstimmung für die Eingabetaste zurückgegeben wird. Die am besten geeignete Datenstruktur, die ich bisher gefunden habe, sind Burkhard-Keller-Bäume , aber ich habe mich gefragt, ob es für diesen Zweck …
Diese Frage wurde von Stack Overflow migriert, da sie in Computer Science Stack Exchange beantwortet werden kann. Vor 7 Jahren migriert . Ich bin gespannt, wie man die Domain eines beliebigen IDN- Hostnamens (wie in RFC5890 definiert ) sehr kompakt komprimieren kann, und vermute, dass dies eine interessante Herausforderung werden …
Sei eine endliche Menge von Zeichen fester Größe. Sei α eine Zeichenkette über Σ . Wir sagen, dass ein nicht leerer Teilstring β von α eine Wiederholung ist, wenn β = γ γ für einen String γ ist .ΣΣ\Sigmaαα\alphaΣΣ\Sigmaββ\betaαα\alphaβ=γγβ=γγ\beta = \gamma \gammaγγ\gamma Nun ist meine Frage, ob das Folgende gilt: …
Ich beschäftige mich mit der Frage nach der asymptotischen Laufzeit des Ukkonen-Algorithmus , dem vielleicht beliebtesten Algorithmus zur Konstruktion von Suffix-Bäumen in linearer (?) Zeit. Hier ist ein Zitat aus dem Buch "Algorithmen für Strings, Bäume und Sequenzen" von Dan Gusfield (Abschnitt 6.5.1): "... die Algorithmen Aho-Corasick, Weiner, Ukkonen und …
Ich habe an dem folgenden Problem aus diesem Buch gearbeitet . Eine bestimmte Zeichenkettenverarbeitungssprache bietet eine primitive Operation, die eine Zeichenkette in zwei Teile aufteilt. Da bei dieser Operation die ursprüngliche Zeichenfolge kopiert wird, werden für eine Zeichenfolge mit der Länge n unabhängig von der Position des Schnitts n Zeiteinheiten …
Wie können Sie bei zwei gegebenen Zeichenfolgen überprüfen, ob sie eine Permutation voneinander sind, indem Sie den O (1) -Raum verwenden? Das Ändern der Zeichenfolgen ist in keiner Weise zulässig. Anmerkung: O (1) Abstand in Bezug sowohl auf die Zeichenkettenlänge als auch auf die Größe des Alphabets.
Levenshtein-Entfernung Abstand zwischen Listen bearbeiten ist ein gut untersuchtes Problem. Aber ich kann nicht viel über mögliche Verbesserungen finden, wenn bekannt ist, dass kein Element mehr als einmal in jeder Liste vorkommt . Nehmen wir auch an, dass die Elemente vergleichbar / sortierbar sind (die zu vergleichenden Listen sind jedoch …
Ich arbeite an String-Suchalgorithmen, die die Suche nach mehreren Mustern unterstützen. Ich habe zwei Algorithmen gefunden, die hinsichtlich der Laufzeit als die stärksten Kandidaten erscheinen, nämlich Aho-Corasick und Rabin-Karp . Ich konnte jedoch keinen umfassenden Vergleich zwischen den beiden Algorithmen finden. Welcher Algorithmus ist effizienter? Welches eignet sich auch besser …
Während eines Interviews für eine Java-Entwicklerposition wurde ich wie folgt gefragt: Schreiben Sie eine Funktion, die zwei Parameter akzeptiert: eine Zeichenfolge, die ein Textdokument darstellt, und eine Ganzzahl, die die Anzahl der zurückzugebenden Elemente angibt. Implementieren Sie die Funktion so, dass eine Liste der nach Worthäufigkeit geordneten Zeichenfolgen zurückgegeben wird, …
Wenn zwei Symbole und sind, definieren wir die te Fibonacci-Zeichenfolge wie folgt:b keina\text{a}bb\text{b}kkk F.( k ) = ⎧⎩⎨beinF.( k - 1 ) ⋆ F.( k - 2 )wenn k=0wenn k=1sonstF(k)={bif k=0aif k=1F(k−1)⋆F(k−2)else F(k) = \begin{cases} \text{b} &\mbox{if } k = 0 \\ \text{a} &\mbox{if } k = 1 \\ F(k-1) …
Ich suche nach einem schnellen k-Mismatch-String-Matching-Algorithmus. Bei einer gegebenen Musterfolge P der Länge m und einer Textzeichenfolge T der Länge n benötige ich einen schnellen (linearen Zeit-) Algorithmus, um alle Positionen zu finden, an denen P mit einer Teilzeichenfolge von T mit höchstens k Fehlpaarungen übereinstimmt. Dies unterscheidet sich vom …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.