Programmierung tokenize

30

Wie kann ich einen String in C ++ tokenisieren?

Java hat eine bequeme Split-Methode: String str = "The quick brown fox"; String[] results = str.split(" "); Gibt es eine einfache Möglichkeit, dies in C ++ zu tun?

414 c++ string split tokenize

16

Analysieren (Teilen) eines Strings in C ++ mit dem String-Trennzeichen (Standard-C ++)

Ich analysiere einen String in C ++ wie folgt: using namespace std; string parsed,input="text to be parsed"; stringstream input_stringstream(input); if (getline(input_stringstream,parsed,' ')) { // do some processing. } Das Parsen mit einem einzelnen Zeichenbegrenzer ist in Ordnung. Aber was ist, wenn ich eine Zeichenfolge als Trennzeichen verwenden möchte? Beispiel: Ich …

361 c++ parsing split token tokenize

15

Was ist der einfachste / beste / korrekteste Weg, um die Zeichen einer Zeichenfolge in Java zu durchlaufen?

StringTokenizer? Konvertieren Sie das Stringin ein char[]und iterieren Sie darüber? Etwas anderes?

340 java string iteration character tokenize

17

So teilen Sie eine Zeichenfolge in eine Shell und erhalten das letzte Feld

Angenommen, ich habe die Zeichenfolge 1:2:3:4:5und möchte das letzte Feld ( 5in diesem Fall) abrufen. Wie mache ich das mit Bash? Ich habe es versucht cut, aber ich weiß nicht, wie ich das letzte Feld mit angeben soll -f.

293 bash split tokenize cut

10

Scanner vs. StringTokenizer vs. String.Split

Ich habe gerade die Scanner-Klasse von Java kennengelernt und frage mich jetzt, wie sie mit dem StringTokenizer und String.Split verglichen wird. Ich weiß, dass StringTokenizer und String.Split nur für Strings funktionieren. Warum sollte ich den Scanner für einen String verwenden? Ist der Scanner nur als One-Stop-Shopping für die Aufteilung gedacht?

155 java java.util.scanner tokenize split

4

Suchen Sie nach einer klaren Definition dessen, was ein "Tokenizer", "Parser" und "Lexer" sind und wie sie miteinander in Beziehung stehen und verwendet werden?

Ich suche nach einer klaren Definition dessen, was ein "Tokenizer", "Parser" und "Lexer" sind und wie sie miteinander zusammenhängen (z. B. verwendet ein Parser einen Tokenizer oder umgekehrt)? Ich muss ein Programm erstellen, das c / h-Quelldateien durchläuft, um Datendeklarationen und Definitionen zu extrahieren. Ich habe nach Beispielen gesucht und …

151 parsing lexer tokenize

5

Kann eine Zeile Python-Code die Verschachtelungsebene für Einrückungen kennen?

Von so etwas: print(get_indentation_level()) print(get_indentation_level()) print(get_indentation_level()) Ich möchte so etwas bekommen: 1 2 3 Kann sich der Code auf diese Weise selbst lesen? Ich möchte nur, dass die Ausgabe der stärker verschachtelten Teile des Codes stärker verschachtelt ist. Auf die gleiche Weise, wie dies das Lesen von Code erleichtert, würde …

149 python reflection metaprogramming indentation tokenize

9

NSString-Token in Objective-C

Was ist der beste Weg, um einen NSString in Objective-C zu tokenisieren / zu teilen?

144 objective-c cocoa tokenize

11

Wie entferne ich die Interpunktion mit dem NLTK-Tokenizer?

Ich fange gerade an, NLTK zu verwenden, und ich verstehe nicht ganz, wie man eine Liste von Wörtern aus Text erhält. Wenn ich benutze nltk.word_tokenize(), bekomme ich eine Liste mit Wörtern und Satzzeichen. Ich brauche stattdessen nur die Worte. Wie kann ich Interpunktion loswerden? Funktioniert auch word_tokenizenicht mit mehreren Sätzen: …

125 python nlp tokenize nltk

13

Aufteilen von Zeichenfolgen in mehrere Zeilen in Oracle

Ich weiß, dass dies bis zu einem gewissen Grad mit PHP und MYSQL beantwortet wurde, aber ich habe mich gefragt, ob mir jemand den einfachsten Ansatz zum Aufteilen einer Zeichenfolge (durch Kommas getrennt) in mehrere Zeilen in Oracle 10g (vorzugsweise) und 11g beibringen kann. Die Tabelle lautet wie folgt: Name …

104 sql string oracle plsql tokenize

4

Wie bekomme ich ein Token von einem Lucene TokenStream?

Ich versuche, Apache Lucene zum Tokenisieren zu verwenden, und ich bin verblüfft über den Prozess, Tokens von a zu erhalten TokenStream. Das Schlimmste ist, dass ich mir die Kommentare in den JavaDocs ansehe, die meine Frage beantworten. http://lucene.apache.org/java/3_0_1/api/core/org/apache/lucene/analysis/TokenStream.html#incrementToken%28%29 Irgendwie soll ein AttributeSourceverwendet werden, anstatt Tokens. Ich bin total ratlos. Kann …

74 java attributes lucene token tokenize

Als «tokenize» getaggte Fragen