WAS SIND CAT-TOOLS?

Das Akronym CAT steht für „Computer Aided Translation“, also für computer-gestützte Übersetzung. Bei CAT-Tools handelt es sich um eine Software, die den menschlichen Übersetzer durch die Bereitstellung von Datenbanken und eine Fülle nützlicher Funktionen unterstützt. CAT-Tools sind nicht zu verwechseln mit der rein maschinellen Übersetzung.

Die Vorteile eines CAT-Tools

Im Gegensatz zur maschinellen Übersetzung, bei der große Datenmengen und hohe Rechenleistung erforderlich sind, läuft die Software des CAT-Tools auf einem herkömmlichen Windows-PC. Mit dem CAT-Tool kann eine Vielzahl von Datenformaten wie Excel, Word, InDesign oder XML bearbeitet werden – das Tool erzeugt daraus ein natives Format, in dem der Übersetzer arbeitet. Nach Abschluss der Übersetzung wird diese wieder ins ursprüngliche Format konvertiert. Die Datenbanken von CAT-Tools müssen vom Nutzer erst erstellt und gefüllt werden.

Im Editor eines CAT-Tools werden dem Übersetzer Ausgangstext und Übersetzung nebeneinander in einer zweispaltigen Ansicht angezeigt. Beim Einlesen einer Datei nimmt das CAT-Tool eine Segmentierung des Textes vor: Der Text wird in sogenannte Übersetzungseinheiten gegliedert. In der Regel löst der Punkt am Ende eines Satzes oder eine Absatzmarke die Segmentierung aus. Die meisten CAT-Tools stellen den Text satzweise dar, einige bieten die absatzweise Segmentierung.

Wie bei der herkömmlichen Textbearbeitung hat der Übersetzer Formatierungswerkzeuge, aber auch eine Grammatik- und die Rechtschreibprüfung zur Verfügung. Zudem gibt es weitere Tools für die Qualitätssicherung. So kann die korrekte Darstellung von Zahlenformaten, vollständige Klammern, korrekte Satzzeichen, überflüssige Leerzeichen und – je nach den gewählten Einstellungen – die maximale Länge eines Segments geprüft werden.

Anmerkung: EHLION bietet auch CAT-Tools Training & Beratung an.

Was ist die translation memory?

Die Datenbanken der CAT-Tools sind zunächst leer. Translation Memories müssen vom Benutzer angelegt und beim Übersetzen mit Satzpaaren gefüllt werden. Termbanken sind eigene Datenbanken, in denen die Fachterminologie mit Beispielsätzen, Definitionen und weiteren Angaben erfasst werden kann. Beide Arten von Datenbanken können in den Editor eingebunden werden. Beim Übersetzen zeigt das CAT-Tool vorhandene Übersetzungseinheiten und Fachausdrücke an. Der Übersetzer prüft diese und kann sie in die Übersetzung übernehmen und nach Bedarf anpassen.

Beim Übersetzen holt das CAT-Tool vorliegende Inhalte aus seinem „Gedächtnis“ – dadurch werden Übersetzungen einheitlicher, auch wenn unterschiedliche Übersetzer zum Einsatz kommen. Im CAT-Tool liegt die letztendliche Entscheidung beim Übersetzer. Auch bei hundertprozentigen Treffern im Translation Memory, den sogenannten 100%-Matches, muss ein Übersetzer den Vorschlag des CAT-Tools prüfen und annehmen. Treffer mit geringerer Übereinstimmung, sogenannte Fuzzy-Matches, müssen entsprechend bearbeitet werden.

Unterschiedliche Arten von Matches

Mit CAT-Tools werden die von einem Übersetzer angefertigten Übersetzungen in einer Datenbank gespeichert, in der Regel als Satzpaare. Bei einer langfristigen Zusammenarbeit mit einem Sprachdienstleister, entstehen unter Umständen sehr umfangreiche Datenbanken. Die Chancen sind also groß, dass es bei weiteren Aufträgen zu einem Anteil an Matches kommt. Denken Sie nur an den „Boilerplate“-Text, der oft Teil von Pressemitteilungen ist oder die Standardüberschriften bei Gebrauchsanleitungen.

Wird ein neuer Text im CAT-Tool erfasst, erfolgt automatisch ein Abgleich mit der Datenbank, in der sich bereits Satzpaare aus abgeschlossenen Übersetzungen befinden. Das heißt, der neue Text wird auf den Grad der Übereinstimmung mit bestehenden Inhalten geprüft. Enthält ein neuer Text Sätze, die identisch in einem früheren Auftrag vorkamen, vermeldet die Match-Analyse 100 %-Matches oder sogar Context Matches. Als sogenannte Context Matches werden 100%-Matches bezeichnet, die mit denselben benachbarten Sätzen bereits in der Datenbank des CAT-Tools gespeichert sind. Matches unter 100% teilt man in Gruppen oder Intervalle, beispielsweise 90-99 %, 80-89% oder 70-79 %. Eine Übereinstimmung unter 70% – bei manchen Tools unter 50% – wird normalerweise als No Match gewertet, da Übersetzer hier in der Regel völlig neu formulieren müssen.

Kostenersparnis durch Matches

Sprachdienstleister gewähren ihren Kunden in der Regel Rabatte, die jeweils von den Matches abhängen. Eine langfristige Zusammenarbeit mit einem Dienstleister lohnt sich also, denn mit der Zeit wachsen auch die Datenbanken und somit gibt es in der Regel häufiger höhere Matches. Dennoch müssen 100%-Matches noch vergütet werden.

Wodurch entstehen unterschiedliche Ergebnisse?

Ein offensichtlicher Grund hierfür ist, dass unterschiedliche CAT-Tools unterschiedliche Datenbestände aufweisen. Wird der Text in ein Tool eingelesen, in dem die Datenbank mit bereits übersetzten Inhalten – das Translation Memory – sehr groß ist, steigt die Wahrscheinlichkeit für eine höhere Trefferquote bei Matches. Bei einem CAT-Tool mit noch leeren Datenbanken gibt es hingegen keine Treffer. Diese Unterschiede können auch auftreten zwischen einem internen Nutzer, der direkt Zugriff auf alle auf einem Server befindlichen Daten hat, und einem externen Übersetzer, dem mittels Datenpaket nur ein unvollständiger Auszug aus der Datenbank übermittelt wurde.

Aber auch bei gleichem Datenbestand kann es zu Unterschieden kommen, da unterschiedliche CAT-Tools auf abweichende Formatierung, Zeilenumbrüche, Absatzmarken, eingebettete Objekte, Links, Tags usw. unterschiedlich reagieren. Es kommt auch auf die Feineinstellung des jeweiligen CAT-Tools an. CAT-Tools können so eingestellt werden, dass es Abzüge bei den Matches gibt, beispielsweise wenn Treffer aus dem Datenbestand eines anderen Fachgebiets oder einer anderen Textsorte stammen. Solche Abzüge werden bewusst eingestellt, damit solche Treffer vom Übersetzer genau geprüft werden.

Darüber hinaus kann es auch vom Dateiformat selbst abhängen, wie das Analyse-Ergebnis ausfällt. Formate wie HTML-, RTF- oder IDML-Dateien können Tags, Makros oder Formatierungen enthalten, die vom vorhandenen Datenbestand abweichen, auch wenn ein wortgleicher Übersetzungsauftrag bereits abgeschlossen wurde. So werden aus 100%-Matches schnell Fuzzy-Matches. Eine abweichende Segmentierung, etwa aufgrund von unterschiedlichen Zeilenumbrüchen in einer PowerPoint-Folie oder einem IDML-Dokument, kann die Matchrate ebenfalls verringern.

Wie Sie Dateien optimal für die Übersetzung vorbereiten, erfahren Sie in weiteren Beiträgen dieses Magazins.

Share this Post