Ich habe es versucht, aber es hat nicht funktioniert.
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
Ich habe es versucht, aber es hat nicht funktioniert.
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
Antworten:
Verwenden Sie [^A-Za-z0-9]
.
Hinweis: Der Leerzeichen wurde entfernt, da dies normalerweise nicht als alphanumerisch angesehen wird.
Versuchen
return value.replaceAll("[^A-Za-z0-9]", "");
oder
return value.replaceAll("[\\W]|_", "");
return value.replaceAll("\\W", "");
Sie sollten sich bewusst sein, dass [^a-zA-Z]
Zeichen ersetzt werden, die sich nicht selbst im Zeichenbereich AZ / az befinden. Das bedeutet , dass Sonderzeichen wie é
, ß
usw. oder kyrillische Zeichen und so wird entfernt.
Wenn das Ersetzen dieser Zeichen nicht gewünscht ist, verwenden Sie stattdessen vordefinierte Zeichenklassen:
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
PS: \p{Alnum}
Erreicht diesen Effekt nicht, er verhält sich genauso wie [A-Za-z0-9]
.
[^\\p{IsAlphabetic}\\p{IsDigit}]
funktioniert gut.
{IsDigit}
funktioniert bei mir nicht und {Digit}
ist, dass ich dies auf Android versuche. Und Android ist UNICODE_CHARACTER_CLASS
standardmäßig aktiviert. Vielen Dank für die Freigabe.
Sie können auch diesen einfacheren regulären Ausdruck ausprobieren:
str = str.replaceAll("\\P{Alnum}", "");
str.replaceAll("[^\\p{Alnum}\\s]", "")
\\p{Alnum}\\p{Space}
.
Ich habe diese Methode zum Erstellen von Dateinamen erstellt:
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]
Wenn ein Caret^
als erstes Zeichen in eckigen Klammern angezeigt wird, wird das Muster negiert. Dieses Muster entspricht jedem Zeichen außer a oder b oder c.
Betrachten Sie das Schlüsselwort als zwei Funktionen:
[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)
Darüber hinaus in Bezug auf ein Muster:
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
Daher werden alle Zeichen ersetzt, die NICHT im Muster enthalten sind
Wenn Sie auch alphanumerische Zeichen zulassen möchten, die nicht zum ASCII-Zeichensatz gehören, wie z. B. deutsche Umlaute, können Sie die folgende Lösung in Betracht ziehen:
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
Bitte beachten Sie, dass die Verwendung des UNICODE_CHARACTER_CLASS-Flags die Leistungseinbußen beeinträchtigen kann (siehe Javadoc dieses Flags).
Einfache Methode:
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
Ausgabe: ChlamydiasppIgGIgMIgAAbs8006
Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
Der CharMatcher von Guava bietet eine präzise Lösung:
output = CharMatcher.javaLetterOrDigit().retainFrom(input);