Im Arabischen gibt es wie in einigen anderen Sprachen sogenannte Diakritika, um die Aussprache zu verbessern. Es gibt keine Konvention darüber, wie viele Diakritika für ein einzelnes Wort geschrieben werden sollen. Einige verwenden das Minimum (das ich bevorzuge) gerade genug, um die Aussprache zu disambiguieren, während andere sie überflüssig oder nur für ästhetische kalligraphische Zwecke verwenden. Daher gibt es große Unterschiede, was und wie viele Diakritika mit einem Wort verbunden sind. Wenn ich isearch-forward/backward
drücke C-s/r
, tritt ein Problem auf, wenn ich es in den Such-Minipuffer ohne diakritische Zeichen eintippe. Wenn es diakritische Zeichen enthält, stimmt es nicht mit demselben Wort im Text überein, sodass die Suche nach diesem Wort mit seinen potenziellen diakritischen Zeichen immer unbefriedigend wird.
Gibt es eine Möglichkeit, die Suche / Regexp-Suche von Diakritika unbewusst zu machen? Ich hoffe, es gibt eine Antwort, die erweitert werden kann, um sie einzuschließen regexp C-M-s/r
und zu grep
suchen, die ich ziemlich oft in Steuerprojektilen verwende, um in Latexprojekten mit mehreren Dateien nach einem Wort zu suchen.
Aktualisieren
Es wäre schön zu sehen, dass Emacs in all seinen Suchfunktionen den Abziehschritt für den Text ausführt (von Akzenten / diakritischen Zeichen / Sie nennen ihn), bevor der Schritt als Standardverhalten abgeglichen wird, das bei Bedarf möglicherweise durch ein Präfix deaktiviert wird egal welche Sprache zur Hand ist. Wenn ich nach etwas suche, erwarte ich normalerweise nicht, dass der beste Editor (Emacs) bei diesem Auftrag versagt, nur aufgrund einiger diakritischer Zeichen oder Akzente, die selten oder nie benötigt werden, um alltägliche Textaufgaben zu erledigen.
php
implementiert: stackoverflow.com/a/25563250/1288722 - auch implementiert in Javascript
: stackoverflow.com/a/7193622/1288722
helm-swoop
?
ucs-normalize-*
Funktionen in anlisp/international/ucs-normalize.el
. Es gibt keine vordefinierte Suchfaltung für diese, wie dies bei der Fallfaltung der Fall ist, aber Sie können zumindest eine Region normalisieren, bevor Sie sie durchsuchen. Eine gute Implementierung ist wahrscheinlich eine ziemlich komplexe Aufgabe.