22.05.2020

Machine Translation mit Post-Editing

Automatische Übersetzungssysteme (Machine Translation) wie Google Translate oder DeepL haben mit Hilfe Künstlicher Intelligenz (KI) ein hohes Sprachniveau erreicht. Die Bedeutung von maschinellen Übersetzungssystemen (MT) nimmt daher immer mehr zu, insbesondere im täglichen Übersetzungsgeschäft. Laut Common Sense Advisory (2016) bieten mittlerweile 80 % der Sprachdienstleister maschinelle Übersetzungen an. Während nutzergenerierte Inhalte ohne Nachbearbeitung direkt maschinell übersetzt werden, was zum Beispiel bei eBay oder Amazon Realität ist, braucht man für anspruchsvollere Aufgaben aber immer noch die Nachbearbeitung, um das Ergebnis zu verbessern. Dieser Vorgang heisst Post-Editing. Post-Editing (PE) bedeutet, dass ein Mensch den Text be- und überarbeitet. PE kombiniert herkömmliche Übersetzungen mit Maschinellen Übersetzungen (Output aus Neural Machine Translation). Durch PE wird der endgültige Zieltext auf ein gut lesbares und korrektes Niveau gebracht.

Vor dem Post-Editing, also sogar bevor der Text maschinell übersetzt wird, gibt es übrigens ebenfalls einen Bearbeitungsschritt: das Pre-Editing. Unter Pre-Editing versteht man die Bearbeitung des Ausgangstextes vor der maschinellen Übersetzung. Der Ausgangstext wird komplett gelesen und geprüft: Tippfehler und ähnliches werden eliminiert, damit der Text von der Maschine gut erkannt wird. Dies lohnt sich besonders, wenn ein Text in mehrere Sprachen übersetzt wird. 

«Machine Translation» (MT) oder deutsch «Maschinelle Übersetzung» (MÜ) bezeichnet die automatische Übersetzung von Texten von einer Sprache in eine andere durch ein Softwaresystem. Bereits in den 2000er Jahren bot die Firma Google ein statistisches Übersetzungssystem an. Die Integration von Künstlicher Intelligenz, insbesondere Deep Learning in die Technologie, die sogenannte «Neural Machine Translation», hat mittlerweile dazu geführt, dass die MÜ ein so hohes Niveau erreicht hat, dass sie bei sehr einfachen Texten manchmal nicht mehr von menschlichen Übersetzungen zu unterscheiden ist. Die neuronale MÜ bedeutet einen bemerkenswerten Fortschritt in der Effektivität und Eignung von maschinellen Übersetzungsprogrammen. Zur Bewertung der Übersetzungsqualität werden Algorithmen wie Bleu Score verwendet, die die Ähnlichkeit der maschinellen Übersetzung mit einer menschlichen Referenzübersetzung messen. Bleu und andere Bewertungsmassstäbe sind mittlerweile als etwas unzuverlässig kritisiert worden. Es gibt heute tolle Systeme, deren Übersetzungen von Menschen als wirklich gut bewertet werden, die aber sehr schlechte Bleu-Bewertungen haben. Entsprechend sucht die Forschung nun nach Alternativen, und diese sind schwierig zu finden. Im Gegensatz zur Bewertung beispielsweise von einem technischen Apparat, der eine gewissenhaft messbare Leistung erbringt, ist es schwierig, eine genaue Beurteilung eines Textes vorzunehmen. Die Thematik ist sehr subjektiv und man erkennt die Herausforderung bereits an der Tatsache, dass abgesehen von kurzen Sätzen kaum zwei Übersetzer die gleiche Übersetzung eines Textes anfertigen.

Wichtige Aspekte von PE
Auf dem Stand des Jahres 2020 erreichen laut einem Test die Übersetzungstools von DeepL und Google Translate die besten Resultate. Maschinelle Übersetzungstools bauen aber trotz aller guten Resultate gerne fiese Fehler ein: Doppelte Verneinungen und falsche Übersetzungen von Namen sind hier einige Beispiele. Es ist für den Post-Editor darum sehr wichtig, dass er weiss, dass sein Text aus einem NMT-Tool kommt. Er achtet dann auf ganz andere Fehler als bei einem human-übersetzten Text.

Eine weitere Herausforderung der maschinellen Übersetzung ist, dass sie oft nicht offensichtliche stilistische Fehler enthält. Es sind oft Fehler, die bei einem oberflächlichen Lesen nicht sofort auffallen, weil sie sprachlich ausgefeilt und gut klingen. Selbst die besten Übersetzungsmaschinen liefern manchmal irreführende Ergebnisse.

Sind Ihre Texte langlebig oder für externe Zwecke und bedürfen einer qualitativ hochwertigen Übersetzung? Dann empfehlen wir Ihnen Post-Editing nach ISO 18587. Post-Editing ist aber nicht einfach ein Korrekturlesen. Es ist eine vollständige Nachbearbeitung durch fachlich qualifizierte und muttersprachliche Lektoren. Sie gleicht einer klassischen Übersetzung. Stil und Terminologie sind einheitlich und auf die Kundenbedürfnisse abgestimmt.

Sind Ihre Texte zeitkritisch oder für den internen Gebrauch? Dann empfehlen wir Ihnen Post-Editing light. Das ist eine einfachere Nachbearbeitung durch fachlich qualifizierte und muttersprachliche Lektoren, hebt sich aber auch klar von einem einfachen Korrekturlesen ab. Hier geht es um Verständlichkeit, korrekte Wiedergabe und Vollständigkeit. Stilfragen und kundeneigene Terminologie werden dabei nicht beachtet. Ein Post-Editing light korrigiert nur offensichtliche Fehler und zielt auf einen verständlichen, aber nicht unbedingt stilistisch ansprechenden Text ab.

Es ist wichtig, zu klären, was vom Zieltext erwartet wird. Der Verwendungszweck entscheidet darüber, ob überhaupt Maschinelle Übersetzung eingesetzt wird, welches Post-Editing dafür vorgenommen werden soll oder ob nicht vielleicht doch ein qualifizierter Fachübersetzer die Arbeit übernehmen soll. Je nach Texttyp oder Sprachkombination kann sich nämlich das Post-Editing durchaus auch als aufwändiger und somit teurer gestalten als eine komplette neue Humanübersetzung.

Ein Nachbearbeiter oder Fachübersetzer kann sich an der neuen Norm «Post-Editing nach ISO 18587» für die «Nachbearbeitung maschinell erstellter Übersetzungen» orientieren. Dort ist beschrieben, wie der menschliche Übersetzer an der von der Maschine erstellten Übersetzung arbeitet, um eine sprachlich korrekte Endfassung zu erhalten.

Anforderungen an Post-Editing (PE)
Durch maschinelle Übersetzung und Nachbearbeitung lassen sich gegenüber dem klassischen Übersetzungsprozess manchmal Kosten sparen. Fast relevanter ist aber der Einsatz bei zeitkritischen Projekten: oft können mit maschineller Übersetzung und Post-Editing grosse Datenmengen in kurzer Zeit übersetzt werden.

Der Zeitaufwand für die Nachbearbeitung ist ein wichtiger Faktor um zu beurteilen, ob der Einsatz von maschineller Übersetzung wirtschaftlich ist oder nicht. Die Nachbearbeitung ist komplexer und zeitaufwendiger als das Korrekturlesen eines von Menschenhand geschriebenen Textes. Ob eine leichte oder vollständige Nachbearbeitung bei der maschinellen Übersetzung erforderlich ist, hängt letztendlich von der Qualität der Rohübersetzung ab. Um die Sprachqualität zu gewährleisten, wird die Verwendung eines professionellen maschinellen Übersetzungssystems empfohlen. Ein solches System wird idealerweise mit früheren Übersetzungen und vorhandener Fachterminologie trainiert.

Post-Editing light
Bei kurzlebigen Texten und interner Kommunikation kann ein Post-Editing light ausreichen, um das Zielpublikum gut zu erreichen und die Kommunikationsbotschaft zu übermitteln. Darüber hinaus spielt die Qualität des Ausgangsmaterials eine wichtige Rolle: Fehlerhafte oder schlecht geschriebene Texte werden vom Übersetzungssystem weniger gut erkannt und den richtigen Kontext gesetzt als gängige Formulierungen.

Post-Editing nach ISO 18587
Die Norm ISO 18587 definiert die Anforderungen an die Nachbearbeitung von maschinellen Übersetzungen. Die Norm wurde von der ISO (Internationale Organisation für Normung) veröffentlicht und ist daher weltweit verbindlich. Der Zweck der Norm ISO 18587 ist es, Verbrauchern und Nutzern von Übersetzungsdiensten mehr Transparenz zu bieten. So verlangt die neue Norm unter anderem, dass der Sprachdienstleister für die Nachbearbeitung spezialisierte Übersetzer (sogenannte Fachübersetzer, die sich im Fachbereich sehr gut auskennen) einsetzt.

Die Texte, die nach ISO 18587 editiert werden richten sich an den Endnutzer und müssen die Funktion des Textes präzise in der Zielsprache erfüllen und gegebenenfalls den kritischen Augen bestimmter Fachkreise standhalten.

Zusammengefasst kann man sagen, dass «Machine Translation» grosse Textmengen schnell und effizient übersetzt. Dabei zeigt sich aber eins immer wieder: Sprache ist ein so komplexes System, dass eine Maschine wohl nie vollkommen fehlerfrei und stilgerecht übersetzen kann. Auch der leistungsfähigste Computer braucht ein Lebewesen, das seine Übersetzungen versteht, prüft und korrigiert.

Newsletter

Ja, News von Apostroph interessieren mich. Bitte schicken Sie mir Ihren Newsletter.

2020

2019

2018

2017

2016

2015

2014

2013

2012