Das Computerprogramm, auf dem ich diese Zeilen geschrieben habe, kennt Sprachen, von denen ich noch nie gehört habe: Fulfulde, Haussa oder Mapudungun. Wikipedia gibt’s in fast allen der 80 europäischen Sprachen, darunter Baskisch, Walisisch, Schottisch-Gälisch oder Okzitanisch. Insgesamt gibt es Wikipedia in 286 Sprachen . Und Google Translate übersetzt mir – um in Europa zu bleiben – vom Galizischen ins Bosnische.
Kunterbunte Sprachvielfalt im Internet also? Schön wär’s: Aktuelle Studien zeichnen ein düsteres Bild. Der ungarische Mathematik-Linguist András Kornai warnt unter dem bedrohlichen Titel « Digital Language Death », dass nur rund 300 der weltweit 7000 Sprachen im Internet überleben werden – im besten Fall. Das sind 4 Prozent. Auch die meisten europäischen Sprachen sind digital schlecht aufgestellt oder gar inexistent. Das europäische Forschungsnetzwerk META-NET überprüfte 30 Sprachen , 21 von ihnen sind – Stand heute – in der digitalen Welt nicht überlebensfähig.
Nur wenige Sprachen werden gut unterstützt
Georg Rehm ist Computerlinguist am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Berlin und Netzwerkmanager von META-NET. Er sagt: «Wir haben in Europa die Situation, dass einige wenige Sprachen technologisch gut unterstützt werden: Englisch, Französisch, Spanisch, das Deutsche schon mit Abstrichen. Und sehr viele Sprachen, die schlecht oder im schlimmsten Fall gar nicht unterstützt werden.» Besonders gefährdet sind laut META-NET etwa Isländisch, Litauisch, Maltesisch, Griechisch, Polnisch oder Ungarisch.
Um auf die Anfangsbeispiele zurückzukommen: Bei Wikipedia gibt es einige wenige Sprachen mit sehr vielen Artikeln. Die meisten auf Englisch, gefolgt von Niederländisch und Deutsch. Und dann gibt es ganz viele Wikipedien mit verhältnismässig wenigen Artikeln – die Baskin oder die Litauin findet zwar ihre Muttersprache, wird aber für viele Artikel gezwungen, auf eine andere Sprache wechseln.
Kleine Sprachen bleiben auf der Strecke
Neue Computertechnologien basieren immer häufiger auf Sprache: automatische Übersetzungsprogramme, die Stimme im Navigerät oder sprachgesteuerte Assistenten, wie wir sie von unseren Smartphones kennen – die nächste Technologiegeneration versteht uns aufs Wort. Theoretisch jedenfalls.
Ein Beispiel ist Siri beim iPhone, das auf Befehl einen Termin erfasst oder mir die SMS vorliest. Kroatisch oder Isländisch beherrscht Siri nicht . Wenn Unternehmen wie Google, Apple oder IBM grosse Summen in Sprachtechnologie investieren, bleiben kleine Sprachen auf der Strecke.
Sendung zum Thema
«Es gibt eine Reihe von Sprachen in Europa, die oftmals nicht bekannt sind, und die auch nur wenige Sprecher haben, teilweise im fünf- oder sechsstelligen Bereich. Das Bestreben von Firmen ist da relativ gering, aufwendige Sprachtechnologien für das Maltesische oder für das Isländische zu bauen», so Georg Rehm. Daher müsse an dieser Stelle die Europäische Union helfen – nicht nur für die 24 offiziellen Sprachen, sondern auch für Nischensprachen wie Galizisch, Baskisch oder Isländisch.
Das kulturelle Erbe bewahren
Der Schutz von Minderheiten ist in Europa historisch begründet – ein Beispiel sind die baltischen Staaten, die sehr lange auch in sprachlicher Hinsicht unterdrückt waren – Russisch wurde ihnen aufgedrückt und die eigene Muttersprache verboten. «Es wäre ein sehr uneuropäischer Gedanke, einer Sprache den Vorzug zu geben und sie zur dominierenden Sprache zu machen», so Georg Rehm.
Im Gegensatz zu den mehrheitlich monolingualen USA kennt Europa etwa 80 Sprachen. Dieses kulturelle Erbe gelte es zu bewahren und zu erweitern, so Rehm: «Wir müssen dafür sorgen, dass unsere Sprachen digital fit werden.» Ebenso wie die Grenzen sollen in Europa auch die Sprachbarrieren fallen – nicht, indem man sich auf eine Sprache einigt, sondern indem man die verschiedenen Sprachen fit macht für die Zukunftstechnologien wie maschinelle Übersetzungstools.
Die Infrastrukturen schaffen
Was tun, damit in Zukunft der Bordcomputer im Auto Maltesisch spricht? Damit die Griechin mühelos eine slowenische Website lesen kann? Die grosse Herausforderung wird nun sein, die sprachtechnologischen Grundlage für diese Sprachen zu schaffen. Solche Software ist auf riesige Datenmengen angewiesen, diese Basis fehlt für kleine Sprachen noch.
Links zum Thema
Im EU-Rahmenprogramm «Horizon 2020» für Forschung und Innovation etwa ist auch der Bereich Sprachtechnologie vertreten. Und in der Initiative «Connecting Europe Facility» (siehe Box), die Europa mit neuer Infrastruktur stärker verbinden will, gibt’s auch eine digitale Komponente. Es ist einiges in Gang, doch für die wirklich grossen Durchbrüche scheint das Geld zu fehlen. Ein Erfolg sei, dass jetzt kleine Sprachen bevorzugt würden, es sollen Technologien speziell für diese kleinen Sprachen erforscht werden. «Das Thema ist im Mainstream angekommen, aber die Erforschung und Entwicklung dieser Technologien ist sowohl aufwendig als auch teuer, so dass mehr Investitionen notwendig werden», so Georg Rehm.
Und wie steht es nun ums Deutsch? Die Sprache ist im Internet relativ stark vertreten und «entgegen aller Unkenrufe nicht in Gefahr», schreibt META-NET als Fazit der oben genannten Studie. Auch im digitalen Raum und im Umgang mit der Technologie werde sie derzeit noch nicht vom Englischen verdrängt. Doch auch hier: «Das kann sich sehr schnell ändern, wenn die Technologie in Kürze die menschliche Sprache beherrscht.»