MASCHINELLE ÜBERSETZUNG MIT DEEPL

Seit den Fünfzigerjahren des letzten Jahrhunderts arbeiten Wissenschaftler und Unternehmen an der Entwicklung künstlicher Intelligenz. So wurden auch bei der maschinellen Übersetzung erhebliche Fortschritte erzielt.

Ermöglicht wurde dies durch leistungsfähigere Hardware und neue Ansätze, wie neuronale Netze und maschinelles Lernen. Neuronale Netze bilden die Vernetzung des menschlichen Gehirns vereinfacht ab.

Ebenfalls wurde die Entwicklung, durch die riesigen Mengen bilingual verfügbarer Inhalte in hoher Qualität, gefördert. Mit diesen Inhalten konnte die künstliche Intelligenz trainiert werden.

Das 2009 in Köln unter dem Namen Linguee gegründete Unternehmen DeepL erregte 2017 mit seinem kostenlosen Angebot DeepL Translator Aufsehen: Die zugrunde liegenden neuronalen Netze lieferten Texte in einer bisher neuen Qualität. Dies bestätigten sowohl automatisierte Evaluierungsmetriken als auch Blindtests, die mit professionellen Übersetzern durchgeführt wurden. Seit 2018 gibt es das kostenpflichtige Angebot DeepL Pro sowie eine API für Entwickler, mit der eine Integration von DeepL in andere Systeme möglich ist. Inzwischen kann DeepL auch in gängige CAT-Tools wie Across, memoQ oder SDL.

Was steckt hinter DeepL?

DeepL wurde seit 2016 aufgebaut, und zwar für jede Art von Text. Dabei wurden maschinelle Lernverfahren und innovative Sprachverarbeitung eingesetzt.

Wie der Name bereits verrät, macht sich das DeepL Übersetzungsprogramm das Deep Learning zu nutze. Deep Learning ist eine Methode des maschinellen Lernens, welche auf neuronale Netzwerke basiert. Vereinfach gesagt, ist die Architektur künstlicher neuronaler Netzwerke vom Lernen im menschlichen Gehirn inspiriert und eröffnet durch ständiges Hinzulernen bisher ungeahnte Möglichkeiten.

So werden Übersetzungen weniger holprig, was jedoch keines Falls heißt, dass DeepL Übersetzungen liefert, die einfach so im professionellen Kontext verwendet werden können. Hier ist ein qualifizierter Übersetzer wie EHLION weiterhin unverzichtbar. Wo der Mensch der Maschine überlegen ist, lesen Sie in diesem Abschnitt.

Was sind neuronale Netzwerke und wie funktionieren sie bei Übersetzungen?

Convolutional Neural Networks (CNN) waren zunächst ein Durchbruch bei der Bilderkennung. Die Übersetzungen bei DeepL werden nun ebenfalls mit Hilfe von CNN erstellt. Die genaue Struktur dieser CNN legt das Unternehmen jedoch nicht offen. Während DeepL mit CNN arbeitet, nutzt die Konkurrenz im Bereich Übersetzungssoftware häufig noch rekurrente neuronale Netzwerke.

Aber wie genau funktioniert so ein neuronales Netzwerk?

Ein neuronales Netzwerk lernt Texte maschinell zu übersetzen, indem es vorher mit bereits existierenden Übersetzungen gefüttert wurde. Anhand von Filtern werden innerhalb dieser Trainingsdaten Muster erkannt und entsprechend interpretiert, sodass daraus abgeleitet werden kann, wie neue Texte übersetzt werden können.

Laut Angaben des Unternehmens wurde DeepL anhand von einer Milliarde Übersetzungen trainiert. Dabei handelt es sich um zweisprachige Sätze, die der Web-Crawler von Linguee im Internet gesammelt hat. Bereits vor dem Start von DeepL konnte man in Linguee einzelne Ausdrücke im Kontext recherchieren. Sämtliche Treffer, die der Web-Crawler anbietet, basieren auf den im Internet bilingual verfügbaren Texten von Unternehmen, Behörden und der EU.

Einer der entscheidenden Unterschiede zu früheren Übersetzungen ist, dass neuronale Netzwerke nicht Wort für Wort übersetzen, sondern den ganzen Satz im Blick haben.

Convolutional Neural Networks besitzen viele Schichten, die es ihnen ermöglichen alle Wörter eines Satzes parallel zu verarbeiten und nicht nacheinander. Dadurch sind sie schneller. Aber CNN sind vor allem aufgrund eines Aufmerksamkeitsmechanismus besser als andere neuronale Netzwerke. Dieser Mechanismus kann auf mehreren Ebenen gleichzeitig wirken. Konkurrenten, wie Google Translate, verwenden zwar auch einen solchen Mechanismus, allerdings nur an einer Schnittstelle.

Aber was macht dieser Aufmerksamkeitsmechanismus genau? Zum Beispiel kann das Wort am Satzende darüber entscheiden , welches das passende Wort für die Übersetzung am Satzanfang ist. Würde das Netzwerk erst am Satzende feststellen, dass es am Anfang des Satzes das falsche Wort gewählt hat, ginge unnötig Zeit verloren. Der Aufmerksamkeitsmechanismus hat solche möglichen Hindernisse im Blick und beseitigt sie.

BLEU ist ein Messverfahren für die Bewertung von Texten, die maschinell übersetzt wurden. Der BLEU-Score der DeepL Übersetzungen ist besser als der anderer Übersetzungsprogramme. Daher vermuten Forscher, dass der auf verschiedenen Ebenen gleichzeitig eingesetzte Aufmerksamkeitsmechanismus es ermöglicht, bestimmte Aspekte der Bedeutung eines Wortes genauer zu extrahieren und so am Ende eine flüssigere Übersetzung zu gewährleisten.

DeepL Übersetzungen im Check

Ein Fachtext aus dem Bereich der Unternehmensfinanzen soll DeepL auf die Probe stellen (siehe Abbildung unten). Der Output von DeepL beeindruckt durch den flüssig wirkenden Text. Stattdessen erhält man sofort einen guten Überblick, worum es in einem Text geht – Liquiditätskennzahlen und die Verbindlichkeiten eines Unternehmens.

Das Ergebnis mit Google Übersetzer wirkt weniger schlüssig. Fachlich versierten Leser sticht sofort ein falscher Fachbegriff ins Auge. Aus „total liability“ wurde im Google Übersetzer „Gesamthaftung“, also ein Begriff aus der Rechtssprache. Gemeint sind hier aber tatsächlich die gesamten finanziellen Verbindlichkeiten des Unternehmens, wie DeepL richtig erkannte.

Dabei gilt es jedoch immer im Hinterkopf zu behalten, dass, nur weil DeepL Übersetzungen flüssiger klingen, bedeutet dies nicht automatisch, dass es sich um qualitativ hochwertige Übersetzungen handelt, die sich problemlos im professionellen Kontext nutzen lassen.

Denn schnell wird deutlich, dass auch bei DeepL nicht alle Fachbegriffe korrekt übersetzt wurden. Die Begriffe „current ratio“ und „quick ratio“ – von DeepL als „aktuelle“ und „schnelle Kennzahlen“ übersetzt – sind Kennzahlen für unterschiedliche Liquiditätsgrade.

Meist wird der Begriff im Deutschen unübersetzt als „Current Ratio“ (oder Barliquidität) und „Quick Ratio“ (oder „Acid Test“) verwendet. Für ein anspruchsvolles Fachpublikum sind maschinell übersetzte Texte ohne Nachbearbeitung durch einen Fachübersetzer und ohne die korrekte Fachterminologie nicht überzeugend. Im Internet kursieren viele ähnliche Beispiele. Manchmal sind die Fehler so subtil, dass sie nur von Experten erkennbar sind.

Auch sollte nicht außer Acht gelassen werden, dass wer DeepL oder andere Online-Übersetzungsprogramme nutzt, um vertrauliche Unternehmensinhalte zu übersetzen, damit in Kauf nimmt, dass diese auf den jeweiligen Servern von DeepL oder der Konkurrenz gespeichert werden.

Trotz des Fortschritts in der maschinellen Übersetzung und dem Einsatz neuronaler Netzwerke, eignet sich DeepL lediglich, um sich einen groben Überblick über den Inhalt eines Textes zu verschaffen. Einen professionellen Übersetzer können solche Programme in keinem Fall ersetzen.

Wer beispielsweise für die Übersetzung der eigenen Webseite nur auf DeepL zurückgreift und der Zielsprache, in die übersetzt wird, nicht mächtig ist, kann weder das Ergebnis welches DeepL liefert beurteilen, noch anpassen. Auf diese Weise riskieren Sie, nicht nur, dass missverständliche und falsche Inhalte auf Ihrer Webseite erscheinen, auch sind Sie nicht in der Lage, Ihre Texte inhaltlich und stilistisch an Ihr Zielpublikum anzupassen.

Bei EHLION arbeiten wir hingegen ausschließlich mit qualifizierten Übersetzern, die neben der gewünschten Sprachkombination auch über das entsprechende Fachwissen verfügen, um Ihre Texte an den Zielmarkt anzupassen.

DeepL für Privatpersonen und Profis

Der DeepL Übersetzer kann kostenlos genutzt werden. Entweder im Webbrowser oder man läd sich die DeepL App herunter.

Wer die App installiert hat, kann auch Texte in Anwendungen auf dem Computer, wie beispielsweise in Word, übersetzen lassen. DeepL bietet Übersetzungen für die folgenden Sprachen: Deutsch, Englisch, Spanisch, Französisch, Portugiesisch, Polnisch, Russisch, Niederländisch und Italienisch.

Jeder der Übersetzungsprogramme wie DeepL nutzt, sollte sich der Tatsache bewusst sein, dass diese Programme online arbeiten. Wer DeepL also mit sensiblen oder vertraulichen Unternehmensinhalten füttert, riskiert, dass diese Daten im World Wide Web unterwegs sind und auf den DeepL Servern gespeichert werden.

Seit 2018 gibt es das kostenpflichtige Angebot DeepL Pro.
Ein Vorteil des Pro Abos liegt im Datenschutz. Im Gegensatz zur kostenfreien Version, werden die hochgeladenen Texte in der Pro Version umgehend von den jeweiligen Servern wieder gelöscht. Aber wie bereits erwähnt, lässt sich auch hier nicht vermeiden, dass Ihre Daten für eine gewisse Zeit online sind.

Seit 2018 gibt es das kostenpflichtige Angebot DeepL Pro sowie eine API für Entwickler, mit der eine Integration von DeepL in andere Systeme möglich ist. Inzwischen kann DeepL auch in gängige CAT-Tools wie Across, memoQ oder SDL integriert werden.

Macht maschinelle Übersetzung wie DeepL Fachübersetzer überflüssig?

Trotz erheblicher Fortschritte können maschinelle Übersetzungen weiterhin keinen qualifizierten Fachübersetzer ersetzen.

Übersetzungsprogramme, wie DeepL, können hilfreich sein, wenn die Veröffentlichung einer Übersetzung gar nicht geplant ist, sondern Sie sich lediglich, einen groben Überblick über den Inhalt verschaffen möchten.

Ob eine maschinelle Übersetzung Sinn macht oder nicht, hängt also von Faktoren wie Textart, Zielgruppe und Kommunikationszweck ab.

Anspruchsvolle Zielgruppen wie Investoren oder Ärzte lassen sich von fehlerhaften Prospekten oder Broschüren wohl eher nicht überzeugen.

Wie gut oder eben schlecht eine maschinelle Übersetzung ist, hängt immer davon ab, mit welchen Inhalten die Maschine zuvor gefüttert wurde.
Um verhältnismäßig gute Übersetzungen zu erzielen, müssen die Datenbanken über Millionen von Inhalten verfügen! Deshalb spielt bei der Qualität einer maschinellen Übersetzung auch die Sprachkombination eine Rolle. Dies hängt von der Struktur und Grammatik der einzelnen Sprachen ab, aber eben auch vom verfügbaren Volumen und von der Qualität der bilingualen Texte, mit denen die Übersetzungsmaschinen trainiert werden.

Auch das jeweilige Fachgebiet hat Einfluss auf das Ergebnis. Schließlich gibt es Spezialthemen, für die nur wenig bilinguales Material verfügbar ist, um eine Engine zu trainieren.

Wo der Mensch der Maschine überlegen ist

Zwar liefert die maschinelle Übersetzung Ergebnisse, die für bestimmte Zwecke gut genug sind. Doch wenn es um Werbetexte mit Wortspielen, Fachtexte mit technischen Ausdrücken oder fehlerhafte bzw. mehrdeutige Texte geht, ist der Mensch der künstlichen Intelligenz überlegen.

Auch für die Lokalisierung, also die Übersetzung sowie die Anpassung von Texten an den Zielmarkt, bleibt der Mensch als Fachübersetzer unverzichtbar. Er beherrscht nicht nur die Sprache, sondern kennt auch die kulturellen Gepflogenheiten eines Landes. Dies ist für eine gelungene Übersetzung unerlässlich und verhindert so manchen peinlichen Fauxpas, den eine Maschine niemals als solchen erkannt hätte.

So ist Spanisch nicht gleich Spanisch. Hat ein Wort eine völlig harmlose Bedeutung in Spanien, hat dasselbe Wort in manchen lateinamerikanischen Ländern eine vollkommen andere Konnotation, wer diese feinen Unterschiede nicht kennt, tritt schnell in ein Fettnäpfchen.

Kenntnis der Fachsprachen

Das Vokabular, das bei der maschinellen Übersetzung mit neuronalen Netzen verwendet wird, ist meist auf die 50.000 bis 80.000 häufigsten Wörter beschränkt. Bestimmte Fachbegriffe stehen deshalb womöglich gar nicht zur Verfügung – man spricht dann von „OOV-Wörtern“ (out of vocabulary). Auch hier sind Fachübersetzer mit ihren fachsprachlichen Kenntnissen überlegen.

Bei EHLION arbeiten wir beispielsweise ausschließlich mit Muttersprachlern. Außerdem kennen sich unsere Übersetzer bestens in ihrer jeweiligen Nische aus und haben stets ihre Zielgruppe vor Augen.
Bei maschinellen Übersetzungen mangelt es hingegen nicht nur immer wieder am Fachvokabular, sondern der Datenbank fehlt es schlichtweg an Fachinhalten, um die Begriffe im Kontext richtig zu übersetzen. Das kann bei medizinischen Übersetzungen fatal sein, in anderen Bereichen, wie im iGaming einfach nur peinlich, wenn der Slang der Gaming-Sprache falsch benutzt wird.

Verständnis der Textlogik

Häufig enthalten Ausgangstexte Logikfehler oder ihr „roter Faden“ ist nicht leicht nachzuvollziehen. Manchmal fehlt einfach das Wort „nicht“ und der Text ist in sich widersprüchlich. Da sich Übersetzer intensiv mit der Bedeutung von Texten befassen, um diese exakt in die gewünschte Sprache zu übertragen, fallen ihnen solche Ungereimtheiten auf – und sie fragen gegebenenfalls beim Auftraggeber nach.

Bearbeitung fehlerhafter Texte

Ausgangstexte und Datenbestände können Fehler enthalten. Insbesondere englische Texte aus aller Welt, die nicht von Muttersprachlern stammen, lassen sich manchmal nur schwer interpretieren. Aber auch ein Tippfehler kann ausreichen, um eine Engine zu überfordern. Übersetzer mit ihren kognitiven Fähigkeiten, können solche fehlerhaften Textstellen interpretieren und einschätzen, wann sie beim Kunden nachfragen sollten.

Kreativität beim Übersetzen

Bestimmte Textsorten erfordern die ganze Kreativität des Übersetzers, wenn etwa Werbung an ausländische Märkte angepasst werden muss. Hier ist eingehende Kenntnis der Kultur, der Zielgruppen und der Sprache gefragt.

Umgang mit Mehrdeutigkeit

In den meisten Sprachen gibt es Wörter, die verschiedene Bedeutungen haben. Diese erschließen sich aus dem Kontext. So erkennt DeepL, dass „liabilities“ in einem Finanztext „Verbindlichkeiten“ bedeutet. Doch andere Systeme wählen hier „Haftung“, einen Begriff aus der Rechtssprache. Humanübersetzer hingegen haben stets den Kontext im Blick. Das können MT Engines wie DeepL aufgrund der großen Bandbreite an Inhalten, aktuell nicht leisten.

Erkennen von Synonymen

Ähnliches gilt für den Umgang mit Synonymen. In der Literatur willkommen, sind Synonyme in bestimmten Textsorten verpönt. Ein versierter Fachübersetzer erkennt, dass „Gerät“, „System“ und „Instrument“ in der Textprobe unten denselben Gegenstand bezeichnen. Als Profi kann er den Auftraggeber beraten, die Terminologie zu vereinheitlichen. Die maschinelle Übersetzung geht einfach darüber hinweg und es entstehen Inkonsistenzen.

Vor- und Nachteile von DeepL im Überblick

Vorteile

Nützlich, um sich einen groben Überblick über den Inhalt eines Textes zu verschaffen
Je nach Bedarf, ist eine kostenlose sowie kostenpflichtige Version verfügbar
Einbindung in professionelle Übersetzungstools ist möglich.

Nachteile

Bei DeepL kann ein Ausgangstext nur in neun Zielsprachen übersetzt werden. Zum Vergleich, der Google Übersetzer befasst sich mit 100 Sprachen.
DeepL ist zwar gut, die Ergebnisse für eine grobe Übersetzung, die noch mit Fehlern behaftet ist, brauchbar, aber nicht fehlerfrei. So ist ein menschlicher Übersetzer generell, besonders aber auch bei komplexen Themen mit viel Fachvokabular, wie bei medizinischen Übersetzungen oder technischen Übersetzungen, weiterhin unverzichtbar.
Das Erkennen und richtige Übersetzen von Mehrdeutigkeiten, Ironie oder dem Tonfall zwischen den Zeilen, kann auch DeepL nicht leisten.

Fazit: DeepL kann keinen qualifizierten Übersetzer ersetzen

Je nach Verwendungszweck, kann eine maschinelle Übersetzung nützlich sein, also beispielsweise, wenn die Texte nicht zur Veröffentlichung gedacht sind und es lediglich darum geht sich einen groben Überblick über den Inhalt eines Textes zu verschaffen. In allen anderen Fällen sind Profi-Übersetzer wie EHLION jedoch immer die bessere Wahl.

Hier finden Sie weitere Informationen zu Deepl und ähnlichen Übersetzungsprogrammen sowie aktuelle Trends in der Übersetzungsbranche

Share this Post