Zum Inhalt springen

Künstliche Intelligenz DeepL: Ein kleines Start-up schlägt Google

Künstliche Intelligenz klingt nach Technologie, die den Grossen der Branche vorbehalten ist. Das Kölner Start-up DeepL beweist das Gegenteil: Es schlägt sogar Googles Übersetzungsdienst Translate, der bis jetzt das Vorzeigebeispiel für maschinelle Übersetzung war. Wie ist das möglich?

Die Unterschiede sind überraschend deutlich, etwa, wenn in der Übersetzung von Emily Brontës Klassiker « Wuthering Heights » bei DeepL vom Nachbarn die Rede ist, «der mir Sorgen bereiten wird». Während Google Translate etwas umständlich vom Nachbarn schreibt, «mit dem ich beunruhigt sein werde».

Oder wenn eine Schlagzeile der französischen Zeitung « Le monde » von DeepL elegant übersetzt wird mit «Künstliche Intelligenz bringt internationale Politik ins Wanken», anstatt mit «Künstliche Intelligenz bereit, internationale Politik zu stören», wie Google das hölzern tut.

Alles Unterschiede, die eine Übersetzung mehr oder weniger natürlich klingen lassen. Das sehen auch professionelle Übersetzer so: In einem Blindtest vor die Wahl gestellt, sollen sie Übersetzungen von DeepL bevorzugt haben, freut sich DeepL-Redaktionsleiterin Silvia Lipski: «Je nach Sprache wurden wir bis zu drei Mal so häufig als Gewinner ausgewählt.»

Viele Forscher stellen sich im Moment die Frage, was DeepL besser macht als die Konkurrenz.
Autor: Martin Volk Professor am Institut für Computerlinguistik der Universität Zürich

Das ist nicht nur Eigenlob. Auch Wissenschaftler sehen DeepL der Konkurrenz überlegen. Zum Beispiel Martin Volk, Professor am Institut für Computerlinguistik der Universität Zürich. Bloss: Wie die guten Resultate zustande kommen, weiss auch Volk nicht – und er ist damit nicht allein: Viele Forscher im Bereich der maschinellen Übersetzung stellen sich momentan die Frage, was DeepL besser macht als die Konkurrenz.»

Die Maschine bringt sich Regeln selber bei

Klar ist: DeepL und Google Translate arbeiten beide mit einem neuronalen Netzwerk. Das ist ein hochkomplexes Computerprogramm, das selbständig Muster in grossen Datenmengen erkennen kann, ohne dass ein Programmierer ihm vorher eigens Regeln beibringen muss.

Ein Roboterkopf lächelt unheimlich vor sich hin.
Legende: Der Einsatz von neuronalen Netzwerken führte in den letzten Jahren zu einer Revolution der maschinellen Übersetzung. Imago

So ein neuronales Netzwerk besteht aus vielen einzelnen Knotenpunkten, die ähnlich wie die Neuronen in einem natürlichen Gehirn funktionieren. Um es für eine bestimmte Aufgabe zu «trainieren», wird es mit riesigen Datenmengen gefüttert.

Durch das Training verschiebt sich die Gewichtung der einzelnen Neuronen. So lernen sie, Muster in den eingegebenen Daten immer besser zu erkennen und immer präzisiere Resultate zu liefern. «Für neuronale Netzwerke, die Texte übersetzen, bedeutet das, dass für einen Eingabesatz ein entsprechender Ausgabesatz in einer anderen Sprache entsteht, der aber dem Sinn des Eingabesatzes entspricht», erklärt Martin Volk die Funktion der maschinellen Übersetzung.

Zu komplex für Menschen

Wie so oft beim Einsatz von künstlicher Intelligenz ist das System so komplex, dass der Mensch nicht mehr genau wissen kann, was darin vor sich geht. Silvia Lipski bezeichnet neuronale Netzwerke wie das von DeepL deshalb als undurchsichtig: Man kenne zwar das Design dieser Netze, die Daten, die eingegeben werden und auch ungefähr die Lernmechanismen solcher Systeme. Aber jeder einzelne Vorgang im Netzwerk könne nicht immer nachvollzogen werden.

Doch auch wenn oft nicht mehr klar ist, was ihn ihnen eigentlich vorgeht, sind neuronale Netzwerke bisherigen Techniken der maschinellen Übersetzung in vielen Bereichen überlegen. Das hat in den letzten zwei Jahren zu einer regelrechten Revolution auf dem Gebiet geführt. Weil neuronale Netzwerke den ganzen Kontext eines Satzes berücksichtigen und nicht nur einzelne Worte übersetzen, klingen ihre Resultate flüssiger und sind besser verständlich.

Vorsprung dank hochqualitativer Daten

Im Moment befinden sich die Technologien in einer Pionierphase, sagt Martin Volk vom Institut für Computerlinguistik. Kleine und grosse Unternehmen hätten noch dieselben Chancen. DeepL sieht sich in diesem Wettkampf gerne als David, der es mit dem Goliath Google aufnimmt. Ein kleines deutsches Start-up mit nur 22 Festangestellten gegen einen Weltkonzern mit über 70'000 Mitarbeitern und einem Jahresumsatz von mehr als 90 Milliarden Dollar.

Ein Laptop-Screen auf dem die Seite von DeepL zu sehen ist.
Legende: Die künstliche Intelligenz von DeepL wurde mit mehr als einer Milliarde hochwertig übersetzten Texten trainiert. Imago/Fotomontage SRF

Doch das Bild täuscht: Denn auch DeepL ist ein Goliath, nämlich dann, wenn es um die Daten geht, mit denen ein neuronales Netzwerk trainiert werden muss. Davon braucht es sehr viele, und sie müssen qualitativ hochwertig sein, damit sich das System keine falschen Regeln beibringt.

Die Macher von DeepL haben seit Jahren solche Übersetzungen zusammengetragen und für das Online-Wörterbuch Linguee gebraucht, das DeepL vorausging. Mehr als eine Milliarde hochwertig übersetzte Texte sind so zusammengekommen. Die meisten davon sind aus dem Internet, sagt DeepL-Sprecherin Silvia Lipski: «Wir durchsuchen das ganze Netz nach hochwertigen Übersetzungen. Zur Bestimmung der Qualität brauchen wir eigene Algorithmen, die wie in den letzten 10 Jahren entwickelt haben.»

Perfekte maschinelle Übersetzung in 10 Jahren

Dank dem Training mit Milliarden von hochqualitativen Daten kann die künstliche Intelligenz von DeepL heute besser übersetzen als die Konkurrenz. Allerdings erst in wenigen Sprachen: Deutsch, Englisch, Französisch, Spanisch, Italienisch, Niederländisch und Polnisch. Bald sollen Mandarin, Japanisch, Russisch und Portugiesisch hinzukommen, bis Ende des Jahres will das Startup 230 Sprachkombinationen anbieten. Zum Vergleich: Google Translate meistert heute schon über 10'000 Sprachpaare.

Ein Finger tippt auf die Google-Translate-Überetzungsapp auf einem Smartphone.
Legende: Der weltweite Umsatz mit Übersetzungs-Dienstleistungen wird auf jährlich bis zu 40 Milliarden Dollar geschätzt. Keystone

In Zukunft könnten sich die Gewichte auch wieder zugunsten der Grossen verschieben. Denn im Geschäft mit maschinellen Übersetzungen geht es um viel Geld: Der weltweite Umsatz mit Übersetzungs-Dienstleistungen wird auf jährlich bis zu 40 Milliarden Dollar geschätzt. Und wenn westliche Firmen in neue Märkte – zum Beispiel im asiatischen Raum – vorstossen wollen, sind sie auf möglichst gute und schnelle Übersetzungen angewiesen.

Die Forschung auf dem Gebiet wird deshalb weitergehen. Martin Volk schätzt, dass Maschinen bestimmte Textsorten schon bald dem Menschen ebenbürtig, aber viel schneller übersetzen können: «Für Gebrauchstexte – und die machen den grössten Teil dessen aus, was heute übersetzt wird – ist eine perfekte maschinelle Übersetzung in den nächsten zehn Jahren durchaus denkbar.»

Anders sieht es bei literarischen Texten aus, bei Poesie oder Humor. Dort geht es um Stil, um Rhythmus und um kulturelle Hintergründe, die in die Übersetzung mit einfliessen müssen. Das sind alles Dinge, mit denen sich der Computer schwertut. Die perfekte maschinelle Übersetzung der Werke von James Joyce oder Marcel Proust liegt deshalb noch in weiter Ferne.

Meistgelesene Artikel