Neuronale maschinelle Übersetzung: Künstliche Intelligenz erleichtert die mehrsprachige Kommunikation

Die weltweite Datenmenge nimmt seit Jahren exponentiell zu. Von dieser Datenmenge – Big Data genannt – profitieren Unternehmen: Ihre Effizienz und Innovation schnellt in die Höhe. Und wir stehen erst am Anfang dieser Entwicklung.

Unternehmen können Daten heute immer effektiver nutzen. Dazu müssen sie zwar Unmengen an Daten verarbeiten, was eine echte Herausforderung ist. Doch Big Data birgt enorme Chancen: Fortschrittliche Übersetzungs- und Lokalisierungstechnologie ermöglicht es Unternehmen, sich die riesige Datenmenge für die mehrsprachige Kommunikation zunutze zu machen und sich schnell global aufzustellen.

Paradigmenwechsel in der Übersetzungsbranche

Die zunehmende Datenmenge ist das eine. Das andere sind zwei Entwicklungen, die zu einem Paradigmenwechsel in der Lokalisierungsbranche geführt haben: das exponentielle Wachstum der Rechnerleistung und Deep Learning.

Deep Learning ist eine Art maschinelles Lernen, das auf künstlicher Intelligenz beruht. Google setzt es in seinen Bild- und Spracherkennungsalgorithmen ein.

Auch die Übersetzungs- und Lokalisierungsbranche nutzt Deep Learning. Aus Deep Learning ist nämlich die neuronale maschinelle Übersetzung (Neural Machine Translation, Neural MT oder NMT) entstanden.

Was ist NMT genau? Und wie macht diese Art der maschinellen Übersetzung die Lokalisierung effizienter?

In einem Webinar erklärt Jay Marciano, Director of Machine Translation bei Lionbridge, warum neuronale maschinelle Übersetzung präziser als bisherige Methoden ist und wie sie die Übersetzungseffizienz steigert.

Wie funktioniert neuronale maschinelle Übersetzung?

Neuronale maschinelle Übersetzung ist relativ neu; erstmals wurde sie Ende 2014 untersucht. Zuvor basierte maschinelle Übersetzung auf einem statistischen Modell (Statistical Machine Translation, SMT) – die Maschine lernte aus den Datenbanken vorheriger Übersetzungen, den sogenannten Translation Memories.

Translation Memories werden sowohl bei SMT- wie auch NMT-Systemen eingesetzt. Bei NMT-Systemen kommen zwei weitere Dinge hinzu: Deep Learning und wesentlich größere Datenmengen. Auf ihrer Grundlage entsteht ein künstliches neuronales Netzwerk.

Marciano vergleicht statistische maschinelle Übersetzung mit Schach: Das „Universum“ eines Schachprogramms ist begrenzt; das Programm lässt nur eine eingeschränkte Anzahl Züge zu. Aus den möglichen Zügen ermittelt das Programm den jeweils besten.

Das maschinelle Lernen in einem SMT-System funktioniert ähnlich: Zur Erkennung von Korrelationen werden Wortgruppen – sogenannte N-Gramme – in der Ausgangssprache mit den in der Zielsprache auftretenden N-Grammen verglichen. Einzelheiten zur SMT und zu N-Grammen finden Sie in unserem Blog-Artikel Maschinelle Übersetzung: Wichtige Begriffe kurz erklärt.

NMT: Aufbau neuronaler Netzwerke

Die neuronale maschinelle Übersetzung kann als Aufbau eines neuronalen Systems bezeichnet werden, so Marciano. Es ist wie Klavierspielen: Wenn Sie einen Fehler machen, gehen Sie einen Schritt zurück, versuchen es erneut und wiederholen die Sequenz, bis sie richtig ist. Genau so bahnen sich NMT-Systeme den richtigen Weg, verknüpfen Daten und bilden neuronale Netzwerke.

Die NMT ist um vieles effektiver als das auf N-Grammen basierende Modell; Letzteres ist häufig ungenau. NMT-Systeme laufen auf leistungsstarken Grafikprozessoren, sogenannten GPUs (Graphical Processing Units), SMT-Systeme dagegen auf CPUs (Central Processing Units).

So wie zuvor die SMT wesentlich mehr Zeit für die Übersetzung benötigte als die älteren regelbasierten Systeme, dauert die Übersetzung eines Satzes mit der NMT länger als mit der SMT. Der Grund dafür sind die riesigen Datenmengen, die verarbeitet werden müssen.

Die NMT ist noch nicht perfekt, etwa bei der Übersetzung hochtechnischer Inhalte. Allerdings ist die NMT keine Ausnahme: Kein MT-System würde einen Text mit vielen technischen Begriffen und Abkürzungen perfekt übersetzen.

Für die NMT gilt: Wenn Sie den Deep-Learning-Algorithmen Trainingsmaterial vorlegen, wissen die Algorithmen noch nicht, wonach sie suchen müssen. Das System muss selbst Muster erkennen, zum Beispiel Kontexthinweise in der Umgebung eines Satzes in der Ausgangssprache. Der genaue Prozess bleibt in vielerlei Hinsicht undurchsichtig.

Neuronale MT und Big Data: Das Ende aller Einschränkungen

Neuronale Netzwerke wurden zuerst in Systemen für die Bild- und Spracherkennung angewendet. Nehmen wir ein Beispiel für die Bilderkennung: das Bild von einem Hund mit den entsprechenden Metadaten. Das System erkennt beim Lesen dieser Metadaten, dass es sich um das Bild eines Hundes handelt.

Bei der Spracherkennung gibt es für den in einer bestimmten Sprache aufgezeichneten Satz in der Regel eine einzige richtige Transkription; diese muss das Deep-Learning-System finden. Das Training von Deep-Learning-Systemen für Transkription ist einfacher als das Training von Deep-Learning-Systemen für Übersetzung. Der Grund: Bei der Übersetzung kann es für einen Satz in der Ausgangssprache mehrere richtige fremdsprachige Entsprechungen geben.

Wir Menschen haben begrenzte Wahrnehmungs- und Analysefähigkeiten, so Marciano. Deep Learning und Big Data erweitern unsere Möglichkeiten. Big Data führt riesige Mengen an Informationen zusammen. Dank Deep Learning können komplizierte Muster und innerhalb dieser Muster Verbindungen mit Verfahren erkannt werden, die außerhalb der Erkennungsmöglichkeiten des Menschen liegen.

Wie bereits erwähnt, lässt sich der NMT-Prozess nicht vollständig nachvollziehen. Ein Großteil der Verarbeitung findet in „verborgenen Schichten“ komplizierter Daten statt. Es ist schwierig, die zugrunde liegenden Entscheidungsprozesse zu verstehen und Fehler in einem neuronalen Netzwerk zu beseitigen.

Folglich können wir nur für das Trainingsmaterial sorgen, die Algorithmen arbeiten lassen und das Trainingsmaterial optimieren, sollten die Übersetzungen nicht korrekt sein.

NMT ist aus der Übersetzungsbranche nicht mehr wegzudenken

Die Sprachkompetenz der NMT verbessert sich derart rasant, dass die NMT aus der Branche nicht mehr wegzudenken ist. Die Unterschiede zwischen einer herkömmlichen Übersetzung und einer maschinellen Übersetzung werden immer kleiner.

Lionbridge bietet seinen Kunden seit 2002 maschinelle Übersetzung und Postediting an. Jahr für Jahr optimieren wir unsere Systeme. 2018 haben wir unsere Lokalisierungsplattform durch Amazon Translate erweitert – ein Angebot von Amazon Web Services (AWS), das auf neuronaler maschineller Übersetzung basiert. Wir werden den Einsatz von MT weiter steigern, um unsere Produktionsprozesse zu beschleunigen.

Auf unserer Website erfahren Sie mehr rund ums Thema Übersetzung und Lokalisierung.

In unserem Blog-Artikel Maschinelle Übersetzung: Wichtige Begriffe kurz erklärt finden Sie eine Erklärung aller wichtigen Begriffe zum Thema maschinelle Übersetzung.