Eine der bekanntesten Ideen von Science-Fiction-Romanen ist der «Übersetzer im Ohr», der dafür sorgt, dass man sich mit jeder Person in jeder Sprache unterhalten kann. Der «Babelfisch» aus «Per Anhalter durch die Galaxis» etwa ist so eine perfekte Übersetzungs-Maschine», von der alle träumen.
Der Traum ist gar nicht mehr in so weiter Ferne. Die «Google Translate»-App zum Beispiel ermöglicht, einen Satz zu diktieren, der dann in einer anderen Sprache ausgegeben wird.
Kein Fisch, aber babbelnd
Komfortabler geht das mit den Ohrhörern «Timekettle WP2 Plus», einer Art grosser Version der «weissen Schwanenhälse», die derzeit aus vielen Ohren herausragen. Begegnen sich zwei Personen mit unterschiedlichen Muttersprachen, können sich beide einen der Hörer ins Ohr stecken – und losreden in ihrer eigenen Sprache. Das Gegenüber hört dann jeweils die übersetzte Version in der jeweiligen Muttersprache.
Wie gut das funktioniert, haben wir mit verschiedenen Personen mit Muttersprache getestet, die keine Landessprache ist.
Erste Erkenntnis: Es funktioniert erstaunlich gut. Wenn beide Personen sich auf einfache Hauptsätze beschränken, entsteht sogar eine Art Dialog. Aber die Qualität der Übersetzung schwankt. So ist die Antwort auf die letzte Frage «alle Funktionen der Küche» mehr als interpretationswürdig.
Kontext wird (oft) berücksichtigt
Im Gegensatz zu maschinellen Übersetzungen aus den Anfängen der Übersetzungstechnologie, analysieren die heutigen Algorithmen auch den Sinn eines Satzes, übersetzen also nicht Wort für Wort.
Ein «dummer» Übersetzungs-Algorithmus hätte in obigem Beispiel etwa übersetzt: «Die verschollene Basilisk» oder «in den Boden versinkende Basilisk».
Damit das funktioniert, muss ein Algorithmus mit möglichst vielen Daten zu einer Sprache trainiert werden und innerhalb der Sprache mit möglichst vielen Themenbereichen (sogenanntes «Machine Learning»).
Hat er zu wenig Daten, kann es vorkommen, dass die Übersetzungsleistung über die ganze Sprache gesehen schlecht ist – oder nur in bestimmten Themenfeldern.
Der Algorithmus für die portugiesische Sprache scheint bei kulinarischen Themen noch nicht so weit trainiert zu sein, dass er bei Sätzen den korrekten Kontext herausfinden kann.
Verwandtschaft zur deutschen Sprache ist zweitrangig
Erstaunlicherweise kommt es heute für die Qualität einer Übersetzung nicht so sehr darauf an, ob die Sprache mit den indogermanischen Sprachen verwandt ist. «Chinesisch – Deutsch» etwa habe man heute sehr gut im Griff, erklärt Rico Sennrich vom Institut für Computerlinguistik der Universität Zürich. Dies, weil die Algorithmen schon gut trainiert sind.
Bei «Deutsch – Tamil» aber scheint dies weniger der Fall zu sein – wenigstens in unserem Test.
Fazit zum Stand der maschinellen Übersetzung heute: Sie vollbringt erstaunliche Leistungen. Aber das ist erst der Anfang. Die Algorithmen werden auch in den nächsten Jahren noch besser, sodass auch Fehler, wie es sie heute noch gibt, immer weniger auftreten werden.
Wir sind deine Korrespondenten aus der digitalen Welt. Ist ein Chip drin oder hängt es am Internet? Wir berichten wöchentlich. Smartphones, soziale Netzwerke, Computersicherheit oder Games – wir erklären und ordnen Digitalisierungs-Vorgänge ein, seit 2006
Um diesen Podcast zu abonnieren, benötigen Sie eine Podcast-kompatible Software oder App. Wenn Ihre App in der obigen Liste nicht aufgeführt ist, können Sie einfach die Feed-URL in Ihre Podcast-App oder Software kopieren.