Als «character-properties» getaggte Fragen

11
JavaScript + Unicode-Regexe
Wie kann ich Unicode-fähige reguläre Ausdrücke in JavaScript verwenden? Zum Beispiel sollte es etwas Ähnliches geben, \wdas mit jedem Codepunkt in der Kategorie Buchstaben oder Markierungen (nicht nur mit den ASCII-Buchstaben) übereinstimmen kann und hoffentlich Filter wie [[P *]] für Interpunktion usw. enthält.

3
Unicode-Äquivalente für \ w und \ b in regulären Java-Ausdrücken?
Viele moderne Regex-Implementierungen interpretieren die \wKurzform der Zeichenklasse als "einen beliebigen Buchstaben, eine Ziffer oder eine verbindende Interpunktion" (normalerweise: Unterstrich). Auf diese Weise, ein regulärer Ausdruck wie \w+Streichhölzer Wörter wie hello, élève, GOÄ_432oder gefräßig. Java leider nicht. In Java \wist beschränkt auf [A-Za-z0-9_]. Dies macht es unter anderem schwierig, Wörter …

2
Python und regulärer Ausdruck mit Unicode
Ich muss einige Unicode-Symbole aus der Zeichenfolge 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' löschen. Ich weiß, dass sie hier sicher existieren. Ich habe es versucht: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ') aber es funktioniert nicht. String bleibt gleich. Was mache ich falsch?
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.