Kann eine E-Mail-Adresse internationale (nicht englische) Zeichen enthalten?


83

Wenn es möglich ist, sollte ich solche E-Mails von Benutzern akzeptieren und welche Probleme sind zu erwarten, wenn ich E-Mails an solche Adressen sende?


5
Es ist traurig, dass diese Frage ungefähr 8 Monate später erneut gestellt wurde und die neue Frage viel mehr Stimmen hat, aber ALLE Informationen dort sind veralteter als die Informationen hier. Ich wünschte, ich könnte alle Antworten hier +5 oder so geben.
John Y

Antworten:


53

Offiziell gemäß RFC 6532 - Ja .

Eine kurze Erklärung finden Sie in Wikipedia zu diesem Thema.



2
Besser noch RFC 6532 und mehr Details hier .

1
Siehe auf jeden Fall den Kommentar von @ BinaryZebra weiter unten in diesem Thread. RFC-5335 ist jetzt veraltet. Sein Nachfolger, RFC-6532, ist der aktuelle Standard (nicht mehr experimentell).
Nate

25

Update 2015: Verwenden Sie RFC 6532

Der experimentelle 5335 wurde veraltet von: 6532 und
dieser wurde später auf "Kategorie: Standards Track" gesetzt,
was ihn zum Standard macht.

In Abschnitt 3.2 (Syntaxerweiterungen zu RFC 5322 ) wurden die meisten Textfelder so aktualisiert,
dass sie (ordnungsgemäßes) UTF-8 enthalten.

The following rules extend the ABNF syntax defined in [RFC5322] and
[RFC5234] in order to allow UTF-8 content.

VCHAR   =/  UTF8-non-ascii
ctext   =/  UTF8-non-ascii
atext   =/  UTF8-non-ascii
qtext   =/  UTF8-non-ascii
text    =/  UTF8-non-ascii
             ; note that this upgrades the body to UTF-8
dtext   =/  UTF8-non-ascii

The preceding changes mean that the following constructs now
allow UTF-8:
   1.  Unstructured text, used in header fields like
       "Subject:" or "Content-description:".
   2.  Any construct that uses atoms, including but not limited
       to the local parts of addresses and Message-IDs. This
       includes addresses in the "for" clauses of "Received:"
       header fields.
   3.  Quoted strings.
   4.  Domains.

Note that header field names are not on this list; these are still
restricted to ASCII.

Bitte beachten Sie die ausdrückliche Aufnahme von Domains.
Und der expliziten Ausschluss von Header - Namen .

Beachten Sie auch NFKC :

The UTF-8 NFKC normalization form SHOULD NOT be used because
it may lose information that is needed to correctly spell
some names in some unusual circumstances.

Und Abschnitt 3 beginnt:

Also note that messages in this format require the use of the
SMTPUTF8 extension [RFC6531] to be transferred via SMTP.

9

Das Problem ist, dass einige Mail-Clients (Server-Tools und / oder Desktop-Tools) dies nicht unterstützen und eine "ungültige E-Mail" -Ausnahme auslösen, wenn Sie versuchen, eine Mail an eine Adresse zu senden, die beispielsweise Umlaute enthält.

Wenn Sie volle Unterstützung wünschen, können Sie die E-Mail-Adressenteile in "Punycode" konvertieren. Auf diese Weise können Benutzer ihre Adressen auf die übliche Weise eingeben, aber Sie speichern sie auf die unterstützte Weise.

Beispiel: müller.com »xn--mller-kva.com

Beide weisen auf dasselbe hin.


6

Ich würde ja annehmen, da eine Reihe von Top-Level-Domains bereits Nicht-ASCII-Zeichen für Domains zulassen und die Domain Teil einer E-Mail-Adresse ist, ist dies durchaus möglich. Ein Beispiel für eine solche Domain wäre www.öko.de


1

kurze Antwort: ja

Nicht nur im Benutzernamen, sondern auch im Domainnamen sind erlaubt.


Wissen Sie, welche Mail-Austauscher / Domains bereits Umlaute im lokalen Teil der E-Mail-Adresse zulassen?
Nanosoft

1

Noch nicht. Das IEEE plant dies: H-Online-Artikel: IEFT plant internationalisierte E-Mail-Adressen . Hier ist die RfC: SMTP-Erweiterung für internationalisierte E-Mail-Adressen

Zitat von H-Online (wie es ging):

Die Internet Engineering Task Force (IETF) hat drei wichtige Dokumente für die Standardisierung von E-Mail-Adressheadern veröffentlicht, die Symbole außerhalb des ASCII-Zeichensatzes enthalten. Dies bedeutet, dass Sie in Kürze chinesische Schriftzeichen, französische Akzente und deutsche Umlaute in E-Mail-Adressen sowie nur im Nachrichtentext verwenden können. Wenn Sie also Zoë heißen und für ein Unternehmen arbeiten, das Fassaden herstellt, sind Sie möglicherweise an einer neuen E-Mail-Adresse interessiert. Aber Vertreter von Anbietern stöhnen bereits. Sie sagen, es müsste eine "Upgrade-Manie" geben, wenn der Unicode-Standard UTF-8 den derzeit als allgemeine E-Mail-Sprache verwendeten amerikanischen Standardcode für den Informationsaustausch (ASCII) ersetzen soll.

RFC 5335 spezifiziert die Verwendung von UTF-8 in praktisch allen E-Mail-Headern. Änderungen müssten an SMTP-Clients, SMTP-Servern, Mail User Agents (MUAs), Software für Mailinglisten, Gateways zu anderen Medien und überall dort vorgenommen werden, wo E-Mails verarbeitet oder weitergeleitet werden. RFC 5336 erweitert das SMTP-E-Mail-Transportprotokoll. Auf der Ebene des Protokolls ist die Erweiterung mit UTF8SMTP gekennzeichnet.

Ein neues Header-Feld wird als eine Art "Notfall-Fallschirm" hinzugefügt, um sicherzustellen, dass UTF-8-E-Mails eine weiche Landung haben, wenn sie vor dem Erreichen des Empfängers durch Systeme, die nicht aktualisiert wurden, verworfen werden. Die "OldAddress" ist eine reine ASCII-Adresse. OldAddress soll jedoch nicht als Kanal für einen zweiten Übertragungsversuch verwendet werden, sondern um sicherzustellen, dass das Feedback nach Hause gesendet wird.

Schließlich stellt RFC5337 sicher, dass korrekte Nachrichten zum Zustellstatus von Nicht-ASCII-E-Mails gesendet werden. Die korrekte Adresse eines nicht erreichbaren Empfängers muss zurückgesandt werden, auch wenn der weitere Transport abgelehnt wurde. Die Arbeitsgruppe E-Mail-Adress-Internationalisierung (EAI) arbeitet auch an einer Reihe von "Downgrade-Mechanismen" für verschiedene Header-Felder und den Umschlag. Wenn möglich, sollen die ursprünglichen Header-Informationen "verpackt" und aufbewahrt werden.

Die deutsche DeNIC, der Registrar für die Domain ".de", nimmt dies dennoch in Kauf. "Wir können wirklich nicht viel tun", erklärte DeNIC-Sprecher Klaus Herzig. DeNIC widmet dem Update, an dem die IETF für den Standard internationaler Domänen arbeitet - RFC3490 oder IDNA2003, wie es manchmal genannt wird - mehr Aufmerksamkeit. "Wir sind nicht so glücklich darüber, weil es keine Abwärtskompatibilität gibt", erklärte Herzig. Wenn das Update kommt, sagt DeNIC, dass es sein Gewicht hinter das Symbol "ß" - auch bekannt als estzett - werfen wird, das bisher übersehen wurde. Der deutsche Registrar sagt auch, dass er angesichts der mangelnden Abwärtskompatibilität möglicherweise etwas warten muss, bevor er wechselt.

Im Gegensatz dazu glauben Experten, dass chinesische Registrare in China und Taiwan die Änderung für internationalisierte E-Mails schnell umsetzen werden. Vertreter von CNIC und TWNIC sind Autoren der Standards. Chinesische Benutzer müssen derzeit E-Mails in ASCII links vom @ und in chinesischen Schriftzeichen rechts davon für chinesische Domains schreiben, die bereits internationalisiert wurden.

(Monika Ermert)


1
Dieser Link ist jetzt tot, als das "The H" heruntergefahren wurde?
David Tonhofer

0

Die Antwort lautet ja, aber sie müssen speziell codiert werden.

Schau dir das an . Lesen Sie den Teil, der sich auf E-Mail-Header und RFC 2047 bezieht.


Wissen Sie, welche Mail-Austauscher / Domains bereits Umlaute im lokalen Teil der E-Mail-Adresse zulassen?
Nanosoft
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.