Unter Linux habe ich ein Verzeichnis mit vielen Dateien. Einige von ihnen haben Nicht-ASCII-Zeichen, aber alle sind gültige UTF-8 -Zeichen . Ein Programm hat einen Fehler, der verhindert, dass es mit Nicht-ASCII-Dateinamen funktioniert, und ich muss herausfinden, wie viele davon betroffen sind. Ich wollte dies mit tun find
und dann ein Grep machen , um die Nicht-ASCII-Zeichen zu drucken, und dann ein wc -l
, um die Nummer zu finden. Es muss nicht grep sein; Ich kann jeden regulären Unix-Standardausdruck wie Perl , sed , AWK usw. verwenden.
Gibt es jedoch einen regulären Ausdruck für "ein Zeichen, das kein ASCII-Zeichen ist"?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]