Maschinelle Übersetzung: Wichtige Begriffe kurz erklärt

Weiterverteilen:Share on Facebook0Share on LinkedIn0Tweet about this on TwitterShare on Google+0

Nach fast 80-jähriger Entwicklungsgeschichte ist die maschinelle Übersetzung heute in aller Munde.

Künstliche Intelligenz (Artificial Intelligence, AI) prägt seit einigen Jahren den Zeitgeist. Immer wieder begegnen wir Schlagwörtern, die mit künstlicher Intelligenz zu tun haben. Eines dieser Schlagwörter ist „neuronale maschinelle Übersetzung“; gerade macht es in verschiedenen Branchen die Runde.

Verbrauchern und Unternehmen stehen immer mehr Anwendungen mit künstlicher Intelligenz zur Verfügung. So ist ein ganzer Wortschatz rund um AI entstanden. Gar nicht so einfach, da den Überblick zu behalten. Was steckt zum Beispiel hinter all den Begriffen zum Thema maschinelle Übersetzung?

Bei Lionbridge arbeiten einige der weltweit erfahrensten Experten für maschinelle Übersetzung. Mit ihrer Unterstützung haben wir diesen Beitrag geschrieben. Er hilft Ihnen, die kleinen und großen Unterschiede zwischen den Begriffen aus der Welt der maschinellen Übersetzung zu verstehen.

1. Künstliche Intelligenz (Artificial Intelligence, AI)

Hinter den neuesten Trends in der maschinellen Übersetzung steckt künstliche Intelligenz. AI ist die Art von „Intelligenz“, die Maschinen nutzen, wenn sie Tasks (also Datenverarbeitungsaufgaben) ausführen, die eigentlich typisch menschliche Denkprozesse voraussetzen, wie Lernen und Problemlösung.

Die zunehmende Leistung der Computer hat die AI in den letzten Jahren beflügelt. Leistungsstärkere Computer bedeuten nicht nur eine höhere Verarbeitungskapazität, sondern auch Fortschritte im maschinellen Lernen (Machine Learning). Durch Machine Learning häufen Computer das „Wissen“ an, das für AI-basierte Anwendungen nötig ist.

2. Maschinelles Lernen (Machine Learning, ML)

Maschinelles Lernen ist eine Disziplin der Computerwissenschaften. Sie nutzt riesige Datenmengen, um Computern beizubringen, wie sie einen Task ausführen müssen. Maschinelles Lernen besteht darin, die Daten zu einem bestimmten Task zu prüfen, Muster in diesen Daten zu erkennen und die Muster zu verknüpfen. Die so gewonnenen Erkenntnisse werden genutzt, um festzulegen, wie der Computer den Task ausführt. Wenn der Computer den Task anschließend besser ausführen kann, hat Machine Learning stattgefunden.

Wir verfügen heutzutage über Daten zu jedem erdenklichen Thema. Maschinelles Lernen steigert die Computerleistung in unzähligen Bereichen, von der Wetterprognose über die automatische Aktienauswahl bis zur maschinellen Übersetzung.

3. Maschinelle Übersetzung (Machine Translation, MT)

Einfach gesagt, bedeutet maschinelle Übersetzung automatisierte Übersetzung: Sie füttern den Computer mit einem Ausgangstext in einer Sprache, und der Computer liefert Ihnen den Text in einer anderen Sprache. Maschinelle Übersetzung ist nicht perfekt. Doch sie ist eines der wichtigsten Hilfsmittel, um effizienter gute Übersetzungen anzufertigen.

Die maschinelle Übersetzung hat in den letzten Jahrzehnten große Fortschritte erzielt: Sie liefert eine bessere Übersetzungsqualität und steht in immer mehr Sprachen zur Verfügung. Ihre Entwicklung zeugt von einer immer ausgereifteren Nutzung des Computers: Bei den ersten MT-Systemen ging es um das simple Ersetzen von Wörtern. Es folgten die regelbasierte maschinelle Übersetzung – mit expliziter Codierung von Grammatik und Lexika – und die statistische maschinelle Übersetzung, die sich auf große Datenmengen stützt. Die jüngsten Etappen: Deep Learning und die neuronalen Netzwerke der neuronalen maschinellen Übersetzung.

4. Statistische maschinelle Übersetzung (Statistical Machine Translation, SMT)

Die statistische maschinelle Übersetzung nutzt maschinelles Lernen, um eine Vielzahl von möglichen Übersetzungen für einen Satz zu generieren. Danach wird die beste Übersetzung ausgewählt – gestützt auf die Wahrscheinlichkeit, dass Wörter und Sätze in der Zielsprache zusammen auftreten.

SMT „lernt“ mithilfe sogenannter N-Gramme (Englisch „n-grams“). Das sind kleine Gruppen von Wörtern, die in der Ausgangssprache und in der Zielsprache zusammen auftreten.

Während des maschinellen Lernens wird das SMT-System mit Trainingsmaterial gefüllt, also mit einer Vielzahl von Beispielsätzen in der Ausgangssprache und ihren Übersetzungen in der Zielsprache. Der Lernalgorithmus unterteilt die Sätze in der Ausgangssprache und die Sätze in der Zielsprache in N-Gramme. Er bestimmt, welche zielsprachlichen N-Gramme wahrscheinlich in einer Übersetzung erscheinen, wenn ein bestimmtes N-Gramm in einem Satz der Ausgangssprache auftritt.

Danach bildet der Lernalgorithmus ein Sprachmodell. Dieses berechnet, wie hoch die Wahrscheinlichkeit ist, dass bestimmte Wörter und Sätze in der Zielsprache nebeneinander auftreten. Wenn das SMT-System nun einen Text übersetzt, gliedert es die Sätze des Ausgangstexts in N-Gramme, findet die passenden N-Gramme in der Zielsprache und generiert mögliche Übersetzungen. Die Wahl fällt auf die Übersetzung, deren N-Gramme am stärksten mit den N-Grammen in der Ausgangssprache korrelieren und deren Wörter in der Zielsprache am ehesten zusammen auftreten.

Die statistische maschinelle Übersetzung funktioniert überraschend gut – gerade wenn man bedenkt, dass das SMT-System keine linguistische Grundlage hat. Das System gründet nicht auf vollständigen Sätzen, sondern auf N-Grammen. Dies im Gegensatz zum neuesten MT-Ansatz: der neuronalen maschinellen Übersetzung.

5. Neuronale maschinelle Übersetzung (Neural Machine Translation, NMT)

Die neuronale maschinelle Übersetzung beseitigt den größten Schwachpunkt der statistischen maschinellen Übersetzung: die Abhängigkeit von der Analyse der N-Gramme. Wie der statistische Ansatz nutzt die neuronale maschinelle Übersetzung die Rechnerleistung und stützt sich auf Trainingsmaterial. Es gibt aber einen gewichtigen Unterschied: Wenn das System das Material aufgenommen hat, bestimmt es selbst, wie es alles über dieses Material – also diese Daten – lernt.

NMT-Systeme erstellen für jeden Satz in der Ausgangssprache sogenannte Informationsvektoren: Sie verknüpfen die Informationen zu jedem Wort mithilfe der benachbarten Wörter. Einige Systeme finden Hunderte von Informationen pro Wort und erreichen so eine hohe Genauigkeit. Dank Deep Learning sammeln NMT-Systeme riesige Mengen von Informationen zu jedem Wort und Satz im Ausgangstext. Mittels eines sogenannten Attention-Modells erkennen sie die für den Übersetzungsprozess wichtigen Informationen. Das Ergebnis sind deutlich flüssigere Übersetzungen. Das heißt, computergenerierte Übersetzungen klingen zusehends natürlicher.

Die neuronale maschinelle Übersetzung ist noch neu, aber bahnbrechend für unsere Branche.

Lionbridge bietet seinen Kunden seit 2002 maschinelle Übersetzung und Postediting an. Jahr für Jahr optimieren wir unsere Systeme. Wir werden den Einsatz von MT weiter steigern, um unsere Produktionsprozesse zu beschleunigen. Auf unserer Website erfahren Sie mehr rund ums Thema Übersetzung und Lokalisierung.

Weiterverteilen:Share on Facebook0Share on LinkedIn0Tweet about this on TwitterShare on Google+0