Wie ist die tatsächliche Qualität von maschinellen Übersetzungen?


27

Bis heute bin ich - als AI-Laie - verwirrt über die versprochenen und erreichten Verbesserungen der automatisierten Übersetzung.

Mein Eindruck ist: Es ist noch ein sehr, sehr weiter Weg. Oder gibt es andere Erklärungen, warum die automatisierten Übersetzungen (angeboten und bereitgestellt von z. B. Google) von ganz einfachen Wikipedia-Artikeln immer noch hauptsächlich albern, kaum lesbar und nur teilweise hilfreich und nützlich sind?

Es mag von persönlichen Vorlieben abhängen (in Bezug auf Lesbarkeit, Hilfsbereitschaft und Nützlichkeit), aber meine persönlichen Erwartungen werden schmerzlich enttäuscht.

Umgekehrt: Sind die Übersetzungen von Google für die Mehrheit der Nutzer dennoch lesbar, hilfreich und nützlich ?

Oder hat Google Gründe, seine Erfolge beizubehalten (und den Nutzern nicht das Beste zu zeigen, was sie zeigen können)?


Vorläufiges Ergebnis: Wir sind noch weit davon entfernt, mit künstlicher Intelligenz gleichberechtigt und verständnisvoll zu sprechen - nur auf der Ebene der Saiten. Warum sollten wir also Angst haben? Weil sie mehr wissen als wir - aber wir wissen es nicht?


2
Maschinelle Übersetzung ist ein schwieriges Problem, zumal moderne Techniken nicht versuchen, den zu übersetzenden Text zu verstehen. Das funktioniert in vielen Fällen mehr oder weniger, kann aber auch spektakulär scheitern. Ich persönlich finde, dass - wenn man bedenkt - die meisten Übersetzungen hilfreich sind, und ich habe keinen Grund zu der Annahme, dass MT-Unternehmen sich zurückhalten. Vielleicht einige domänenspezifische Anwendungen, die kommerziell sensibler sind, aber nicht allgemein MT.
Oliver Mason

@OliverMason: "Moderne Techniken versuchen nicht, den zu übersetzenden Text zu verstehen" - ist das das Wesentliche, das gesagt werden muss? So muss ich die Ergebnisse von MT verstehen? Traurig genug. (Ein Widerspruch aus der KI-Community wäre sehr willkommen!)
Hans-Peter Stricker

1
@ Hans-PeterStricker: Nun, es begann wirklich alles, als Fred Jelinek bemerkte, dass feuernde Linguisten seine Spracherkennung genauer machten. Seitdem haben verschiedene Formen des maschinellen Lernens die regelbasierte KI überholt, und jetzt haben wir kaum eine Ahnung, wie die meisten KI-Systeme "wirklich funktionieren" - außer vielleicht auf stochastischer Ebene.
Kevin

2
@ Hans-PeterStricker Es ist nicht wirklich hilfreich, sich ein modernes KI-System als etwas zu "verstehen" vorzustellen. Stellen Sie sich das System eher als ein System vor, das eine Reihe von Eingaben akzeptiert und eine Reihe von Ausgaben erstellt. Die Eingabe kann ein englischer Text und die Ausgabe ein spanischer Text sein. Das System hat dies aus einer ganzen Reihe von englischen Texten und den entsprechenden spanischen Texten gelernt. Bedeutet das, dass es Englisch oder Spanisch versteht? Das ist eher eine philosophische Frage. Was praktisch zählt, ist, dass es Englisch mit einem gewissen Maß an Zuverlässigkeit in Spanisch umwandeln kann.
Josh Eller

Es wurde in den Antworten leicht angesprochen, aber ich denke, es lohnt sich darauf hinzuweisen, dass die Antwort stark von den Sprachpaaren abhängt, über die Sie sprechen. Die Qualität von Englisch <-> Spanisch ist bei weitem höher als die von Englisch <-> Japanisch.
mbrig

Antworten:


21

Wer hat behauptet, dass maschinelle Übersetzung so gut ist wie ein menschlicher Übersetzer? Für mich als professionellen Übersetzer, der seit 35 Jahren von der Übersetzung lebt, bedeutet MT, dass meine tägliche Produktion von qualitativ hochwertigen Übersetzungen um den Faktor 3 bis 5 gestiegen ist, abhängig von der Komplexität des Ausgangstextes.

Ich kann nicht zustimmen, dass die Qualität von MT mit der Länge der eingegebenen Fremdsprache abnimmt. Das galt früher für die alten Systeme mit semantischen und grammatikalischen Analysen. Ich glaube nicht, dass ich alle alten Systeme kenne (ich kenne Systran, ein trashiges Tool von Siemens, das wie ein Danaer-Geschenk, XL8, Personal Translator und Translate von einer Firma zur nächsten verkauft wurde), sondern sogar ein professionelles System in die ich 28.000 DM investiert habe (!!!!) ist kläglich gescheitert.

Zum Beispiel der Satz:

An diesem heißen Sommertag musste ich arbeiten und es war ein Schmerz im Arsch.

kann mit mehreren MT-Tools ins Deutsche übersetzt werden.

Persönlicher Übersetzer 20 :

Auf diesem heißen Sommertag musste ich arbeiten, und es war ein Schmerz im Esel.

Eingabeaufforderung :

An diesem heißen Sommertag musste ich arbeiten, und es war ein Schmerz im Esel.

DeepL :

An diesem heißen Sommertag musste ich arbeiten und es war eine Qual.

Google:

An diesem heißen Sommertag musste ich arbeiten und es war ein Schmerz im Arsch.

Heute liefert mir Google in der Regel lesbare, fast korrekte Übersetzungen, und DeepL ist noch besser. Erst heute Morgen habe ich in 3 Stunden 3500 Wörter übersetzt und das Ergebnis ist einwandfrei, obwohl der Quelltext voller Fehler war (geschrieben von Chinesisch).


4
Für diejenigen von uns, die kein fließendes Deutsch sprechen, ist nicht klar, welche dieser Alternativen gut und welche schlecht sind. Ich weiß, dass "Esel" "Esel (Tier)" und "Arsch" "Esel (Körperteil)" bedeutet. Ich weiß nicht, was "Qual" bedeutet oder ob "ein Schmerz im Arsch" akzeptabel ist.
Stig Hemmer

3
"Schmerz im Esel" ist komisch (und falsch). "Arsch" ist ein eher umgangssprachliches Wort, das Sie im schriftlichen Deutsch nicht gebrauchen würden. "Qual" ist "Schmerz", daher ist es meiner Meinung nach die bessere Wahl, wenn auch nicht ganz richtig, da der Satz eher Ärger als wirklichen Schmerz ausdrückt.
Oliver Mason

1
@OliverMason Qual ist eine gute Übersetzung: dict.leo.org/englisch-deutsch/qual
yunzen

4
@OliverMason Ich bin ein deutscher Muttersprachler und halte es für ziemlich passend
am

5
@ OliverMason "Schmerz im Arsch" ist eine Redewendung. "Schmerz im Arsch" ist nicht: Das sagt niemand. "Qual" ist eine genaue Übersetzung des englischen Idioms, die im Gegensatz zu dem, was Sie gesagt haben, selten tatsächlichen körperlichen Schmerz bezeichnet (und "Qual" kann auch sowohl buchstäblicher als auch bildlicher Schmerz sein). Ohne weiteren Kontext scheint die DeepL-Übersetzung perfekt zu sein.
Konrad Rudolph

7

Googles Übersetzungen können nützlich sein, insbesondere wenn Sie wissen, dass die Übersetzungen nicht perfekt sind und nur eine erste Vorstellung von der Bedeutung des Texts haben möchten (deren Google-Übersetzungen manchmal irreführend oder falsch sein können). Ich würde Google's translate (oder einem anderen nicht-menschlichen Übersetzer) nicht empfehlen, um eine ernsthafte Übersetzung durchzuführen, es sei denn, es handelt sich möglicherweise um einen gemeinsamen Satz oder ein gemeinsames Wort, es handelt sich nicht um sehr lange Texte und eine informelle Sprache (oder einen Slang) Englisch oder Sie haben keinen Zugang zu einem menschlichen Übersetzer.

Google Translate verwendet derzeit ein neuronales maschinelles Übersetzungssystem . Um dieses Modell (und ähnliche Modelle) auszuwerten, wird die BLEU-Metrik verwendet0100100

In der Arbeit Making AI Meaningful Again diskutieren die Autoren auch die Schwierigkeit der Übersetzungsaufgabe (von der angenommen wird, dass sie ein AI-vollständiges Problem darstellt ). Sie erwähnen auch den Transformator (ein weiteres hochmodernes maschinelles Übersetzungsmodell), der ziemlich schlechte Ergebnisse erzielt (bewertet mit der BLEU-Metrik).

Zusammenfassend ist die maschinelle Übersetzung ein schwieriges Problem, und aktuelle maschinelle Übersetzungssysteme sind definitiv nicht so leistungsfähig wie ein professioneller menschlicher Übersetzer.


100 BLEU Score bedeutet nicht, dass die Übersetzung nach menschlichem Goldstandard erfolgt, sondern dass sie genau mit der Referenzübersetzung übereinstimmt. Da es normalerweise mehrere Möglichkeiten gibt, einen Satz zu übersetzen, hat selbst die menschliche Übersetzung normalerweise keine 100 BLEU, sondern eher 50-60.
Nur der halbe

@justhalf Lies meine Antwort nochmal.
nbro

1
Vielen Dank für die Antwort, und sorry, wenn mein vorheriger Kommentar unhöflich erschien. Mein Punkt in meinem vorherigen Kommentar war, dass es ungenau ist, den Eindruck zu erwecken, dass die menschliche Übersetzung 100 BLEU-Punkte erhalten wird, was Ihre aktuelle Antwort zu tun scheint.
Nur der halbe

@justhalf Ich habe das gerade gesagt 100entspricht einer menschlichen "Goldstandard" -Übersetzung. Ich stelle jedoch auch fest, dass die BLAUE Metrik nicht perfekt ist, da es häufig mehr als eine Übersetzung eines bestimmten Textes gibt.
Nr.

5

Sie haben eine ganze Reihe von Fragen gestellt, von denen einige nicht endgültig beantwortet werden können. Um einen Einblick in die Qualität (und die Geschichte) von maschinellen Übersetzungen zu geben, verweise ich auf Christopher Manning, seinen 'Ein-Satz-Maßstab', wie er in seinem Vortrag vorgestellt wurde . Es enthält ein Beispiel für Chinesisch nach Englisch, das mit der Ausgabe von Google Translate verglichen wird. Die richtige Übersetzung für das Beispiel wäre:

1519 landeten 600 Spanier in Mexiko, um das Aztekenreich mit einigen Millionen Einwohnern zu erobern. Sie verloren zwei Drittel ihrer Soldaten im ersten Zusammenprall.

Google Translate hat die folgenden Übersetzungen zurückgegeben.

2009 landeten 1519 600 Spanier in Mexiko, Millionen Menschen eroberten das Aztekenreich, die ersten zwei Drittel der Soldaten gegen ihren Verlust.

2011 landeten 1519 600 Spanier in Mexiko, Millionen Menschen, um das Aztekenreich zu erobern, der anfängliche Verlust von Soldaten, zwei Drittel ihrer Begegnungen.

2013 landeten 1519 600 Spanier in Mexiko, um das Aztekenreich zu erobern, Hunderte Millionen Menschen, der anfängliche Konfrontationsverlust der Soldaten zwei Drittel.

2015 landeten 1519 600 Spanier in Mexiko, Millionen von Menschen, um das Aztekenreich zu erobern, die ersten zwei Drittel des Verlustes an Soldaten, die sie zusammenstoßen.

2017 Im Jahr 1519 landeten 600 Spanier in Mexiko, um die Millionen von Menschen des Aztekenreiches zu erobern, die erste Konfrontation, bei der sie zwei Drittel töteten.

Ob Google behält seine besten Ergebnisse oder "verbirgt": Ich bezweifle es. Auf dem Gebiet der Verarbeitung natürlicher Sprache (NLP) arbeiten viele hervorragende Forscher. Wenn Google einen „größten Erfolg“ bei der Übersetzung erzielen würde, würden die Forscher dies früher oder später herausfinden. (Warum sollte Google ihre "größte Leistung" überhaupt verbergen? Sie scheinen den Nutzen von Open Source zu erkennen, siehe Transformer [1] oder BERT [2].)

NB. Eine aktualisierte Liste der neuesten Algorithmen in NLP finden Sie in der SQuAD2.0-Bestenliste .

[1] Vaswani, Ashish et al. "Aufmerksamkeit ist alles was du brauchst." Fortschritte in neuronalen Informationsverarbeitungssystemen. 2017.

[2] Devlin, Jacob et al. "Bert: Pre-Training von tiefen bidirektionalen Transformatoren für das Sprachverständnis." arXiv-Vorabdruck arXiv: 1810.04805 (2018).


Vielen Dank für den Link zu "gut bezahlten Forschern". Vergütungen im Auge zu haben hilft immer, die Dinge besser zu verstehen (auch wenn ich nicht weiß, was Sie beim Setzen dieses Links im Sinn hatten).
Hans-Peter Stricker

Das Argument war auch nicht sehr solide. Habe den Link entfernt und versucht das Argument zu verbessern. Ich habe viele NLP-Artikel gelesen und bin von meinen Ergebnissen ziemlich überzeugt, aber es ist schwierig, Unterstützung für das Argument zu finden.
RikH

Bitte teilen Sie mir Ihre Ergebnisse mit (falls Sie nichts dagegen haben). Meine Mailadresse finden Sie auf meiner Profilseite.
Hans-Peter Stricker

1
2019 :In 1519, 600 Spaniards landed in Mexico to conquer the Aztec empire of millions of people, and they first met two-thirds of their soldiers.
Dan M.

4

Es kommt wirklich auf das Sprachpaar und das Thema des Inhalts an. Das Übersetzen von / nach Englisch in eine andere Sprache wird normalerweise am besten unterstützt. Das Übersetzen in und aus populären Sprachen funktioniert besser, zum Beispiel ist das Übersetzen von Englisch nach Rumänisch eine schlechtere Übersetzung als das Übersetzen von Englisch nach Russisch. Das Übersetzen von Englisch nach Russisch oder Rumänisch ist jedoch besser als das Übersetzen von Russisch nach Rumänisch. Und das Übersetzen von Rumänisch nach Englisch ist besser als das Übersetzen von Englisch nach Rumänisch.

Aber wenn Sie es gewohnt sind, mit Übersetzern zu arbeiten, und wenn Sie mit den Sprachen, Übersetzungsfehlern und dem Thema vertraut sind, ist es leicht zu verstehen, was eigentlich dort sein sollte. Und zu diesem Zeitpunkt ist es manchmal einfacher, etwas zu lesen, das in Ihre Muttersprache übersetzt wurde, um es schnell zu scannen, als es in einer zweiten Sprache zu lesen.

Weniger beliebte Sprachen (für die Übersetzung nicht unbedingt die Anzahl der Sprecher) kommen wörtlichen Übersetzungen nur geringfügig näher als das, was Sie persönlich mit einem Wörterbuch für zwei Sprachen tun würden, die Sie nicht kennen.


2

Liege ich falsch und sind die Übersetzungen von Google dennoch für die Mehrheit der Nutzer lesbar, hilfreich und nützlich?

Ja, sie sind etwas hilfreich und ermöglichen es Ihnen, schneller zu übersetzen.

Oder hat Google Gründe, seine größten Erfolge beizubehalten (und den Nutzern nicht das Beste zu zeigen, was sie zeigen können)?

Vielleicht weiß ich es nicht. Wenn Sie nach Informationen suchen, macht Google wirklich eine Menge schrecklicher dummer Dinge, wie beispielsweise das Lernen aus den Aussagen der Nutzer im Internet, indem Sie ungeeignete Daten als vertrauenswürdige Eingabedatensätze verwenden.


2

Entschuldigung, dass Sie nicht auf Englisch geschrieben haben. Die angepasste Übersetzung finden Sie hier:

Um Interessenten einen Eindruck von der Qualität von MT (DeepL) zu vermitteln, sehen Sie sich dieses Beispiel anhand eines Textes an, an dem ich heute Morgen gearbeitet habe (6.300 Wörter, angefangen um 9 Uhr, heute gegen 13 Uhr zugestellt und noch Zeit für diesen Beitrag). Ich habe an diesem Satz (201 Wörter) gearbeitet, als ich meinen Kommentar gepostet habe.

oder Prozesse, die ausgeführt oder aktiviert werden, während Sie nicht auf dieser Website angemeldet sind oder die auf andere Weise die ordnungsgemäße Funktionsweise dieser Website beeinträchtigen oder eine unzumutbare Belastung der Infrastruktur dieser Website verursachen; oder (e) Verwenden manueller oder automatisierter Software, Geräte oder anderer Prozesse, um eine Seite dieser Website zu "crawlen", "zu kratzen" oder "zu spinnen"; oder (f) den Quellcode dieser Website zu dekompilieren, zurückzuentwickeln oder auf andere Weise zu versuchen. "

DeepL gibt dies zurück:

(A) betrügerische, missbräuchliche oder anderweitig illegale Aktivitäten, die ausgeführt werden, um die Nutzung dieser Website und / oder der Dienste zu ermöglichen; oder (b) Mit Abteilungen oder Aufforderungen, die dazu bestimmt sind, Passwörter, Konten oder private Informationen von anderen Nutzern dieser Website zu erhalten, zu posten oder zu übertragen oder zu posten oder zu übertragen; oder (c) die Sicherheit eines Computernetzwerks verletzen, Passwörter oder Sicherheitsverschlüsselungscodes knacken, illegales Material (einschließlich Material, das als bedrohlich oder obszön angesehen werden kann) übertragen oder speichern oder sich an illegalen Aktivitäten beteiligen, die ausdrücklich verboten sind; oder (d) Mailliste, Listenserver oder jede andere Form von Auto-Responder oder "Spam" auf dieser Website oder Prozessen, die aktiviert werden, während Sie nicht auf dieser Website angemeldet sind, oder anderweitig das ordnungsgemäße Funktionieren or a unangemessene Belastung der Infrastruktur dieser Website stören; oder (e) manuelle oder automatisierte Software, Geräte oder andere Prozesse verwenden, um eine Seite dieser Website zu "crawlen", zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückentwickeln oder anderweitig versuchen, den Quellcode dieser Website zu erhalten. the running or activated when you not on this website login are, or other wide the ordnungsgemäße function using a unangemessene exposure of the infrastructure of the website stören; oder (e) manuelle oder automatisierte Software, Geräte oder andere Prozesse verwenden, um eine Seite dieser Website zu "crawlen", zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückentwickeln oder anderweitig versuchen, den Quellcode dieser Website zu erhalten. the running or activated when you not on this website registered, or other wide the ordnungsgemäße function using a unangemessene exposure of the infrastructure of the website stören; oder (e) manuelle oder automatisierte Software, Geräte oder andere Prozesse verwenden, um eine Seite dieser Website zu "crawlen", zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückentwickeln oder anderweitig versuchen, den Quellcode dieser Website zu erhalten. zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückentwickeln oder anderweitig versuchen, den Quellcode dieser Website zu erhalten. zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückentwickeln oder anderweitig versuchen, den Quellcode dieser Website zu erhalten.

Ich habe ungefähr 5 bis 10 Minuten gebraucht, um diesen Absatz anzupassen.

Als Übersetzer weiß ich, dass ich mich nicht auf die maschinelle Übersetzung verlassen kann, aber ich habe die Besonderheiten und Fähigkeiten der verschiedenen Systeme im Laufe der Zeit gelernt und weiß, worauf ich achten muss.

MT hilft mir sehr bei meiner Arbeit.


2
Beachten Sie, dass Rechtstexte zu besseren automatischen Übersetzungen führen, da es in diesem Bereich eine Unmenge mehrsprachiger Texte gibt.
Quora Feans

1

Dies wird weniger eine Antwort als vielmehr ein Kommentar sein.

Die Qualität hängt von mehreren Dingen ab, einschließlich (wie Aaron oben sagte) 1) dem Sprachpaar und 2) dem Thema, aber auch 3) den Gattungen und 4) dem Stil des Originals und 5) der Menge des parallelen Texts, den Sie haben das MT-System zu trainieren.

Um die Bühne zu bereiten, basieren praktisch alle MT heutzutage auf parallelen Texten, d. H. Einem Text in zwei verschiedenen Sprachen, wobei eine vermutlich eine Übersetzung der anderen (oder beide eine Übersetzung einer dritten Sprache) ist. und möglicherweise Verwendung von Wörterbüchern (möglicherweise unterstützt durch morphologische Prozesse) als Backoff, wenn die parallelen Texte keine bestimmten Wörter enthalten.

Darüber hinaus versteht, wie andere gesagt haben, ein MT-System die zu übersetzenden Texte in keiner Weise. Es werden nur Zeichenfolgen und Wortfolgen aus Zeichen angezeigt, und es wird nach ähnlichen Zeichenfolgen und Folgen in zuvor übersetzten Texten gesucht. (Ok, es ist etwas komplizierter als das, und es gab Versuche, Semantik in Rechensystemen zu erlernen, aber im Moment sind es meistens Zeichenketten.)

1) Sprachen variieren. Einige Sprachen haben eine Menge Morphologie, was bedeutet, dass sie Dinge mit einem einzigen Wort tun, die andere Sprachen mit mehreren Wörtern tun. Ein einfaches Beispiel wäre Spanisch "Cantaremos" = Englisch "wir werden singen". Und eine Sprache kann Dinge tun, mit denen die andere Sprache nicht einmal zu tun hat, wie zum Beispiel die informelle / formelle (tu / usted) Unterscheidung in Spanisch, mit der Englisch kein Äquivalent hat. Oder eine Sprache kann Dinge mit der Morphologie tun, die eine andere Sprache mit der Wortreihenfolge tut. Oder das von der Sprache verwendete Skript markiert möglicherweise nicht einmal Wortgrenzen (Chinesisch und einige andere). Je unterschiedlicher die beiden Sprachen sind, desto schwieriger wird es für das MT-System, zwischen ihnen zu übersetzen. Die ersten Versuche zur statistischen MT wurden zwischen Französisch und Englisch durchgeführt.

2) Thema: Wenn Sie Paralleltexte in der Bibel haben (was für fast alle geschriebenen Sprachen zutrifft) und Ihr MT-System auf diese Sprachen trainieren, sollten Sie nicht damit rechnen, dass es bei technischen Texten gute Ergebnisse erzielt. (Nun, die Bibel ist ohnehin eine relativ kleine Textmenge, wenn man MT-Systeme trainiert, aber tu so als ob :-).) Das Vokabular der Bibel unterscheidet sich sehr von dem der technischen Texte, ebenso wie die Häufigkeit verschiedener grammatikalischer Ausdrücke Konstruktionen. (Die Grammatik ist im Wesentlichen dieselbe, aber auf Englisch erhalten Sie beispielsweise viel mehr Passiv und zusammengesetzte Substantive in wissenschaftlichen und technischen Texten.)

3) Genera: Wenn Ihr Paralleltext deklarativ ist (z. B. Traktorhandbücher), erhalten Sie keine guten Ergebnisse, wenn Sie versuchen, das resultierende MT-System im Dialogfeld zu verwenden.

4) Stil: Denken Sie Hilary gegen Donald; gelehrt vs. beliebt. Ein Training auf der einen Seite bringt auf der anderen Seite keine guten Ergebnisse. Trainieren Sie das MT-System auch für Romane auf Erwachsenenebene und verwenden Sie es für Kinderbücher.

5) Sprachpaar: Englisch hat viele Texte, und die Chancen, Texte in einer anderen Sprache zu finden, die parallel zu einem bestimmten englischen Text sind, sind viel höher als die Chancen, Paralleltexte beispielsweise in Russisch und Igbo zu finden. (Das heißt, es kann Ausnahmen geben, wie in Indien.) Als grobe Verallgemeinerung gilt: Je mehr solche parallelen Texte Sie im MT-System trainieren müssen, desto besser sind die Ergebnisse.

In der Summe ist Sprache kompliziert (weshalb ich es liebe - ich bin ein Linguist). Kein Wunder also, dass MT-Systeme nicht immer gut funktionieren.

Übrigens, menschliche Übersetzer machen das auch nicht immer so gut. Vor ein oder zwei Jahrzehnten bekam ich Übersetzungen von Dokumenten von menschlichen Übersetzern ins Englische, um sie als Schulungsmaterial für MT-Systeme zu verwenden. Einige der Übersetzungen waren schwer zu verstehen, und in einigen Fällen, in denen wir Übersetzungen von zwei (oder mehr) menschlichen Übersetzern erhielten, war es schwer zu glauben, dass die Übersetzer dieselben Dokumente gelesen hatten.

Und schließlich gibt es (fast) nie nur eine richtige Übersetzung; Es gibt mehrere Möglichkeiten, eine Passage zu übersetzen, die je nach den gewünschten Merkmalen (grammatikalische Korrektheit, Stil, Konsistenz der Verwendung, ...) mehr oder weniger gut sein können. Es gibt kein einfaches Maß für "Genauigkeit".


1

Erstaunlicherweise sind alle anderen Antworten sehr vage und versuchen, dies vom menschlichen Übersetzer POV zu verstehen. Wechseln wir zu ML Engineer.

Eine der ersten Fragen, die wir beim Erstellen eines Übersetzungstools berücksichtigen sollten, lautet: "Wie messen wir, ob unser Tool funktioniert?".

Welches ist im Wesentlichen, was das OP fragt.

Dies ist keine leichte Aufgabe (einige andere Antworten erklären, warum). Es gibt einen Wikipedia - Artikel , in dem verschiedene Methoden zur Bewertung von maschinellen Übersetzungsergebnissen erwähnt werden - es gibt sowohl menschliche als auch automatische Bewertungen (wie BLEU , NIST , LEPOR) ).

Mit dem Aufstieg der neuronalen Netzwerktechniken verbesserten sich diese Werte signifikant.

Übersetzung ist ein komplexes Problem. Es gibt viele Dinge, die richtig (oder falsch) laufen können, und das Computerübersetzungssystem ignoriert häufig einige der Feinheiten, die für einen menschlichen Sprecher von Bedeutung sind.

Ich denke, wenn wir über die Zukunft nachdenken, gibt es einige Dinge, auf die wir uns verlassen können:

  • Unsere Techniken werden immer besser, bekannter und erprobter. Dies wird die Genauigkeit auf lange Sicht verbessern.
  • Wir entwickeln neue Techniken, die zuvor ignorierte Variablen berücksichtigen oder einfach bessere Arbeit leisten können.
  • Viele der derzeit verfügbaren Übersetzungsmodelle werden häufig für die Übersetzung anderer Sprachen "wiederverwendet". Versuchen Sie beispielsweise, "JEDEN" mit Google Translator aus dem Polnischen ins Chinesische (traditionell) zu übersetzen. Am Ende erhalten Sie "ONE", was darauf hinweist die Tatsache, dass Google Polnisch ins Englische und dann Englisch ins Chinesische übersetzt). Dies ist offensichtlich kein guter Ansatz - Sie werden dabei einige Informationen verlieren -, aber er wird weiterhin funktionieren, sodass Unternehmen wie Google ihn für Sprachen verwenden, in denen sie nicht über genügend Arbeitskräfte oder Daten verfügen. Mit der Zeit werden spezialisiertere Modelle auftauchen, die die Situation verbessern werden.
  • Wie bereits erwähnt, werden immer mehr Daten nur dazu beitragen, die maschinelle Übersetzung zu verbessern.

Zusammenfassend lässt sich sagen, dass dieses komplexe Problem, obwohl es nicht gelöst ist, auf einem guten Weg ist und beeindruckende Ergebnisse für gut recherchierte Sprachpaare liefert.


"Überraschenderweise alle anderen Antworten ...", nicht alle anderen Antworten. Ich würde "Einige andere Antworten" oder "Die meisten anderen Antworten" sagen.
nbro

0

"Oder hat Google Gründe, seine Erfolge beizubehalten (und den Nutzern nicht das Beste zu zeigen, was sie zeigen können)?"

Wenn sie es wären, wäre es erstaunlich , was sie zurückhalten . Google veröffentlicht viele starke Artikel in Natural Language Processing, auch solche, die es bekommen die aktuelle Ergebnisse erzielen oder bedeutende konzeptionelle Durchbrüche erzielen . Sie haben auch sehr nützliche Datensätze und Tools veröffentlicht . Google ist eines der wenigen Unternehmen, das nicht nur den neuesten Stand der Forschung nutzt, sondern aktiv zur Literatur beiträgt.

Maschinelle Übersetzung ist nur ein schweres Problem. Ein guter menschlicher Übersetzer muss beide Sprachen fließend beherrschen, um die Arbeit gut zu machen. Jede Sprache hat ihre eigenen Redewendungen und nicht wörtliche oder kontextabhängige Bedeutungen. Nur mit einem zweisprachigen Wörterbuch zu arbeiten, würde schreckliche Ergebnisse bringen (für einen Menschen oder einen Computer). Daher müssen wir unsere Modelle auf vorhandene Korpora trainieren, die in mehreren Sprachen existieren, um zu lernen, wie Wörter tatsächlich verwendet werden (nb handkompilierte Phrase) Übersetzungstabellen können als Features verwendet werden (sie können einfach nicht die ganze Geschichte sein). Für einige Sprachpaare gibt es viele parallele Korpora (z. B. für EU - Sprachen haben wir die vollständige Verfahren des Europäischen Parlaments vor). Für andere Paare sind die Trainingsdaten viel sparsamer. Und selbst wenn wir Trainingsdaten haben, gibt es weniger benutzte Wörter und Sätze, die nicht oft genug zum Lernen erscheinen.

Dies war früher ein noch größeres Problem, da Synonyme schwer zu erklären waren. Wenn unsere Trainingsdaten Sätze für "Der Hund hat den Ball gefangen" hätten, aber nicht "Der Welpe hat den Ball gefangen", hätten wir eine geringe Wahrscheinlichkeit für den zweiten Satz. In der Tat wäre eine signifikante Glättung erforderlich, um zu verhindern, dass die Wahrscheinlichkeit in vielen solchen Fällen Null ist.

Das Auftauchen neuronaler Sprachmodelle in den letzten 15 Jahren hat dieses Problem massiv gelöst, indem Wörter einem realwertigen semantischen Raum zugeordnet werden konnten, bevor die Zusammenhänge zwischen Wörtern erlernt wurden. Auf diese Weise können Modelle erlernt werden, in denen Wörter, deren Bedeutung eng beieinander liegt, auch im semantischen Raum eng beieinander liegen. Ein Wortwechsel für das Synonym hat daher keinen großen Einfluss auf die Wahrscheinlichkeit des enthaltenen Satzes. word2vecist ein Modell, das dies sehr gut illustriert; Es zeigte sich, dass Sie z. B. den semantischen Vektor für "König" nehmen, den Vektor für "Mann" subtrahieren, den Vektor für "Frau" hinzufügen und herausfinden können, dass das nächste Wort zum resultierenden Vektor "Königin" ist. Als die Forschung an neuronalen Sprachmodellen ernsthaft begann, stellten wir sofort einen massiven Rückgang der Ratlosigkeit fest (dh wie verwirrt die Modelle von natürlichem Text waren), und jetzt stellen wir einen entsprechenden Anstieg des BLEU-Scores (dh der Übersetzungsqualität) fest Sprachmodelle werden in maschinelle Übersetzungssysteme integriert.

Maschinelle Übersetzungen sind immer noch nicht so gut wie hochwertige menschliche Übersetzungen und werden wahrscheinlich erst dann so gut sein, wenn wir eine völlig erfahrene KI knacken. Gute menschliche Übersetzer sind jedoch teuer, während jeder mit Internetzugang über maschinelle Übersetzer verfügt. Die Frage ist nicht, ob die menschliche Übersetzung besser ist, sondern wie nahe die Maschine diesem Qualitätsniveau kommt. Diese Lücke ist geschrumpft und schrumpft weiter.


Ich mag diesen Ansatz nicht - aber das ist eine Frage des Geschmacks und der Meinung. Wenn ich auf eine "gelernte / begabte / verstehende" Übersetzung verzichte, nur weil "menschliche Übersetzer teuer sind", fühle ich mich traurig. Worum geht es dann beim Übersetzen?
Hans-Peter Stricker

@ Hans-PeterStricker Beim Übersetzen geht es darum, mit Menschen kommunizieren zu können, mit denen Sie keine gemeinsame Sprache haben. Die maschinelle Übersetzung ist derzeit gut genug, um uns dies zu ermöglichen, obwohl die daraus resultierenden Übersetzungen oftmals nicht grammatisch sind oder wie ein Nicht-Muttersprachler klingen. (Fortsetzung ...)
Ray

Je nachdem, was Sie unter "Gelernt / Begabt / Verstehen" verstehen, tun wir das möglicherweise bereits. Das ist die Abbildung auf einen semantischen Vektor. Die Wörter sind in einen Vektorraum eingebettet, der ihre zugrunde liegende Bedeutung darstellt. Das von mir verlinkte Sutskever-Papier (als "konzeptuell") übersetzt tatsächlich den gesamten Satz auf einen semantischen Vektor und konvertiert diesen Vektor dann in einen Satz in der Zielsprache. So "Verständnis" einer Art geschieht definitiv dort. (Fortsetzung ...)
Ray

Es gibt auch Modelle , die die zugrunde liegende lernen Syntax (dh Satzbau), und es hat auf der Arbeit gewesen , dass die Integration in neuronale Modelle, obwohl im Moment, Modelle , die lernen , welche Teile des Satzes sie zahlen sollten Aufmerksamkeit zu zu einem bestimmten Zeitpunkt scheinen effektiver mit solchen Dingen umzugehen als mit den expliziten syntaktischen Modellen. (Fortsetzung ...)
Ray

Wenn Sie nicht der Meinung sind, dass ein solches "Verständnis" als wahres Verständnis gilt, was würde dann als anderes zählen als eine KI, die den Turing-Test besteht, dh eine vollkommen begabte? Beachten Sie, dass ich nie gesagt habe, dass wir keine voll ausgereifte KI machen können (ich kann nicht sagen, wie lange es dauern wird; das ist nicht mein Teil des Fachgebiets. Aber ich habe wenig Zweifel, dass wir es irgendwann schaffen werden). Aber die Modelle, die ich hier beschreibe, sind das, was wir jetzt verwenden , und sie eignen sich ziemlich gut, um Menschen die Kommunikation zu ermöglichen. Bei der AI-Forschung geht es darum, immer bessere Versionen von "gut genug" zu bekommen
Ray
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.