Dies wird weniger eine Antwort als vielmehr ein Kommentar sein.
Die Qualität hängt von mehreren Dingen ab, einschließlich (wie Aaron oben sagte) 1) dem Sprachpaar und 2) dem Thema, aber auch 3) den Gattungen und 4) dem Stil des Originals und 5) der Menge des parallelen Texts, den Sie haben das MT-System zu trainieren.
Um die Bühne zu bereiten, basieren praktisch alle MT heutzutage auf parallelen Texten, d. H. Einem Text in zwei verschiedenen Sprachen, wobei eine vermutlich eine Übersetzung der anderen (oder beide eine Übersetzung einer dritten Sprache) ist. und möglicherweise Verwendung von Wörterbüchern (möglicherweise unterstützt durch morphologische Prozesse) als Backoff, wenn die parallelen Texte keine bestimmten Wörter enthalten.
Darüber hinaus versteht, wie andere gesagt haben, ein MT-System die zu übersetzenden Texte in keiner Weise. Es werden nur Zeichenfolgen und Wortfolgen aus Zeichen angezeigt, und es wird nach ähnlichen Zeichenfolgen und Folgen in zuvor übersetzten Texten gesucht. (Ok, es ist etwas komplizierter als das, und es gab Versuche, Semantik in Rechensystemen zu erlernen, aber im Moment sind es meistens Zeichenketten.)
1) Sprachen variieren. Einige Sprachen haben eine Menge Morphologie, was bedeutet, dass sie Dinge mit einem einzigen Wort tun, die andere Sprachen mit mehreren Wörtern tun. Ein einfaches Beispiel wäre Spanisch "Cantaremos" = Englisch "wir werden singen". Und eine Sprache kann Dinge tun, mit denen die andere Sprache nicht einmal zu tun hat, wie zum Beispiel die informelle / formelle (tu / usted) Unterscheidung in Spanisch, mit der Englisch kein Äquivalent hat. Oder eine Sprache kann Dinge mit der Morphologie tun, die eine andere Sprache mit der Wortreihenfolge tut. Oder das von der Sprache verwendete Skript markiert möglicherweise nicht einmal Wortgrenzen (Chinesisch und einige andere). Je unterschiedlicher die beiden Sprachen sind, desto schwieriger wird es für das MT-System, zwischen ihnen zu übersetzen. Die ersten Versuche zur statistischen MT wurden zwischen Französisch und Englisch durchgeführt.
2) Thema: Wenn Sie Paralleltexte in der Bibel haben (was für fast alle geschriebenen Sprachen zutrifft) und Ihr MT-System auf diese Sprachen trainieren, sollten Sie nicht damit rechnen, dass es bei technischen Texten gute Ergebnisse erzielt. (Nun, die Bibel ist ohnehin eine relativ kleine Textmenge, wenn man MT-Systeme trainiert, aber tu so als ob :-).) Das Vokabular der Bibel unterscheidet sich sehr von dem der technischen Texte, ebenso wie die Häufigkeit verschiedener grammatikalischer Ausdrücke Konstruktionen. (Die Grammatik ist im Wesentlichen dieselbe, aber auf Englisch erhalten Sie beispielsweise viel mehr Passiv und zusammengesetzte Substantive in wissenschaftlichen und technischen Texten.)
3) Genera: Wenn Ihr Paralleltext deklarativ ist (z. B. Traktorhandbücher), erhalten Sie keine guten Ergebnisse, wenn Sie versuchen, das resultierende MT-System im Dialogfeld zu verwenden.
4) Stil: Denken Sie Hilary gegen Donald; gelehrt vs. beliebt. Ein Training auf der einen Seite bringt auf der anderen Seite keine guten Ergebnisse. Trainieren Sie das MT-System auch für Romane auf Erwachsenenebene und verwenden Sie es für Kinderbücher.
5) Sprachpaar: Englisch hat viele Texte, und die Chancen, Texte in einer anderen Sprache zu finden, die parallel zu einem bestimmten englischen Text sind, sind viel höher als die Chancen, Paralleltexte beispielsweise in Russisch und Igbo zu finden. (Das heißt, es kann Ausnahmen geben, wie in Indien.) Als grobe Verallgemeinerung gilt: Je mehr solche parallelen Texte Sie im MT-System trainieren müssen, desto besser sind die Ergebnisse.
In der Summe ist Sprache kompliziert (weshalb ich es liebe - ich bin ein Linguist). Kein Wunder also, dass MT-Systeme nicht immer gut funktionieren.
Übrigens, menschliche Übersetzer machen das auch nicht immer so gut. Vor ein oder zwei Jahrzehnten bekam ich Übersetzungen von Dokumenten von menschlichen Übersetzern ins Englische, um sie als Schulungsmaterial für MT-Systeme zu verwenden. Einige der Übersetzungen waren schwer zu verstehen, und in einigen Fällen, in denen wir Übersetzungen von zwei (oder mehr) menschlichen Übersetzern erhielten, war es schwer zu glauben, dass die Übersetzer dieselben Dokumente gelesen hatten.
Und schließlich gibt es (fast) nie nur eine richtige Übersetzung; Es gibt mehrere Möglichkeiten, eine Passage zu übersetzen, die je nach den gewünschten Merkmalen (grammatikalische Korrektheit, Stil, Konsistenz der Verwendung, ...) mehr oder weniger gut sein können. Es gibt kein einfaches Maß für "Genauigkeit".