FALSE FRIENDS, GOOD AND BAD TRANSLATION

DeepL is NOT very intelligent

14.01.2022 | 1 Kommentar

6000 Zeichen – longish read.

Die Online-Übersetzungsmaschine DeepL hat in den letzten Jahren the world of translation mächtig aufgemischt. Sie ist rasend schnell und auch noch gratis (bzw. die Pro-Version sehr kostengünstig). Sie ist meist besser als die Internet-Konkurrenz.

Ich habe manche einfachen Texte von Kunden durch die Premium-Lösung gejagt – nach dem Motto: „das muss selbst DeepL können“. Ich war durchwegs negativ überrascht. Die Überarbeitung war stets aufwendiger als eine Von-Null-Auf-Übersetzung.

Wie funktioniert DeepL eigentlich?

DeepL basiert auf künstlicher Intelligenz / artificial intelligence. Sie durchforstet Millionen von Ausgangstexten und deren vorhandenen Übersetzungen („Training Data“) auf der Suche nach Mustern – und vergleicht die Resultate mit einem „natürlichen Sprachmodell“.

Mediocre practice not best practice

Das bedeutet: Es wird fast immer die beliebteste 0815-Lösung (DeepL: the 0815 solution) übernommen – nicht unbedingt die beste. Denn die beste Lösung ist das Ergebnis von Erfahrung, Recherche, Spezialisierung, Rückfragen und Denkarbeit. Die 0815-Lösung ist das Ergebnis von „schnell, schnell“, „das wird schon reichen“ und „das sagen alle anderen auch“.

Beispiel: „Jede Homepage muss ein Impressum haben“ = „Each homepage must have an imprint“. „Homepage“ ist in 99% der Fälle falsch (= website). „Imprint“ ist komplett daneben. Aber sie sind sehr, sehr weit verbreitete Falsch-Übersetzungen. Also sagt DeepL: Das nehme ich! It is the stupidity of the crowd.

Bei schlichten Aufgaben geht das meist glimpflich aus. Bei den typischen Fallen, in die menschliche Übersetzer reintappen, stolpert auch DeepL und bricht sich dabei das Genick. Dazu gehören viele knifflige Fachbegriffe oder Ausdrücke, false friends wie „individuell“ sowie übertragene Bedeutungen – „Er ist ein Politiker zum Anfassen“ ergibt „He is a politician to touch“.

Selbst banale Redewendungen kennt die Software nicht. DeepL ist eben kein Native Speaker. Und hat keine Allgemeinbildung. Sie ist ein Muster-Monster. „Thank you for the flowers“ sagt sie dazu – leider.

 

Pants!

DeepL versteht zum Teil Kontext. Aber nur zum Teil. Sie kommt schnell aus dem Konzept. Bei einem Artikel über Bäuerinnen in Afrika war DeepL überzeugt, es ging um farmer’s wives. Dabei haben die Bäuerinnen gepflanzt, bewässert und geerntet. Vielleicht ist die Software bloß frauenfeindlich?

Will heißen: In dem Moment, in dem die Aufgabe nur ein klein wenig schwieriger wird, geht es schnell in die Hose (O-Ton: That goes quickly in the pants). Aber für mich geht es um viel mehr.

DeepL macht standardmäßig Sachen, die ich meinen Praktikanten schon am ersten Tag verboten habe.

Ich sagte immer: Übersetz nicht die einzelnen Sätze/Wörter sondern die Aussage. Wie würdest du die Message selbst ausdrücken? Aber das kann DeepL gar nicht – sie versteht keine Aussagen. Nur Muster. Und übersetzt tasächlich SATZ FÜR SATZ und WORT FÜR WORT. Durch DeepL wird nichts umgestellt, verknüpft, verkürzt, korrigiert oder klarer/besser formuliert. Fast jeder Satz aus dem digitalen Munde von DeepL klingt furchtbar und unnatürlich – irgendwie „nicht ganz richtig“.

Noch so ein Ding: Für mich war und ist Regel Nr. 1: Don’t guess. DeepL rät ständig. Und weist nicht mal darauf hin. Red alert!!! Ein Mitarbeiter, der sowas bei mir gemacht hätte, hätte eine Abmahnung bekommen.

Garbage in, garbage out

Ein schwach formulierter Ausgangstext wird in der Zielsprache noch schlechter. Überhaupt basieren Software-Übersetzungsmaschinen auf der irrwitzigen Annahme, der Ausgangstext wäre logisch, fehlerfrei und gut formuliert. Doch das ist seltenst der Fall.

DeepL stellt keine Fragen sondern „versucht’s halt“. DeepL schreibt keine Notizen, Erklärungen oder Hinweise. DeepL recherchiert nicht. Sie ruft nicht an. Sie denkt nicht mit. DeepL ist nicht konsistent. Selbst innerhalb eines Textes. Bei einem Dokument zur Patienteneinwilligung wurde an einer Stelle „volljährig“ mit „adult“, an einer anderen mit „age of majority“ übersetzt. Manchmal hieß es „data is“, manchmal „data are“.

DeepL erkennt nicht, wenn irgendetwas einfach komplett falsch sein muss. „Paris is the capital of Hungary“ wird nicht in Frage gestellt. Wenn ein ganz wichtiges „nicht“ offensichtlich fehlt, wird es eben auch in der Zielsprache weggelassen.

Woof!

Offensichtlich vermittelt DeepL nicht immer direkt zwischen zwei Sprachen sondern zum Teil über Englisch. Als ich wissen wollte, wie „Es regnet in Strömen“ auf Russisch heißt, kam eine kyrillische Version von „It’s raining cats and dogs“ dabei raus.

In manchen Bereichen klappt es besser als in anderen. Dazu gehören Finanzen und EU-Themen. Ich vermute, es hat damit zu tun, dass in beiden Fällen die Ausgangstexte sehr professionell und vorsichtig formuliert werden. Die Übersetzungen werden häufig von echten Fachleuten erstellt und kritisch überprüft. Darüber hinaus: Die Fachbegriffe sind meist lange bekannt und klar definiert.

Auch „Profis“ setzen DeepL ein. Leider.

Immer mehr Human Translators nehmen das Output von DeepL und geben es einfach weiter – vielleicht ein wenig angepasst.  Aber die schwierigen Stellen werden nicht wirklich angepackt (denn das kostet wieder zu viel Zeit). Ich bin in letzter Zeit mehrmals gebeten worden, Übersetzungen von Profis bzw. Büros zu evaluieren – und habe dabei nicht selten die schmutzige Handschrift von DeepL entdeckt. Dadurch werden Übersetzungen für den Massenmarkt billiger und schneller aber eindeutig schlechter.

 

A slow learner

Natürlich ist DeepL nützlich. Und sie wird auch (langsam) besser. Vor allem der Vergleich mit dem natürlichen Sprachmodell bietet Potenzial. Bei der Pro-Version kann man auch Glossare für Fachbegriffe hochladen. Es ist vielleicht möglich (so nach dem Grammatik/Schreibstil-Checker Grammarly), DeepL besseres Englisch beizubringen. Man kann DeepL auch Best Practice Translation vielleicht beibringen. Aber dazu braucht es Menschen mit den richtigen Kompetenzen.

Und da landet DeepL endlich einen Treffer: „people with the right skills“.

 

Blogbeitrag teilen:

1 Kommentar

  1. Philip Mann

    Excellent points here. You mention EU texts. I think the reason DeepL is “good” at these is because so many of them exist concurrently in all the EU languages. I was talking to a lawyer friend the other day who told me she regularly uses DeepL for translations of legal texts (for internal purposes, I hope). In this particular case there was a bitter dispute as to the meaning of “upon receipt.” She fed the English legal text into DeepL and it came up with precisely the official German text. This made her think DeepL was the best thing since sliced bread. Unfortunately, it ain’t (as you so rightly say). In this case, the German version of the legal text had “nach Erhalt.” Now, for me (and for one of the parties to the dispute), “nach Erhalt” isn’t the same as “upon receipt.” But DeepL has been told it’s the same, and that’s good enough for DeepL.
    Anyway, I wouldn’t touch DeepL with a barge pole, and I sincerely hope nobody reading this blog would either. As they say in Private Eye, more power to your organ…

    Antworten

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht.