Siri, Google Now, Cortana: Die Sprachassistenten in unseren Smartphones sind in den letzten Jahren massiv besser geworden, vor allem wegen der riesigen Rechenleistung, die heute zur Verfügung steht. Sie ist notwendig, um innert Sekunden ein Wort oder einen ganzen gesprochenen Satz erkennen zu können.
Schwiitzerdütsch verstehen die drei Assistenten aber nicht. Das ist eine Marktlücke, die Google, Apple und Microsoft nicht bedienen. In die Bresche springen Startups wie Recapp, das den Swisscom-TV-Boxen Dialekt beigebracht hat .
Oder Spitch, ein Unternehmen, das sich auf sprachgesteuerte Software vor allem für Call-Center spezialisiert hat. Für die SBB hat Spitch nun einen «Sprach-Fahrplan» entwickelt.
Nicht sprechen, wie uns der Schnabel gewachsen ist
Wirklich intuitiv ist die neue Funktion allerdings nicht, weil der Benutzer sich an vorgegebene Befehle halten muss: «Vu Züri uf Lausanne» funktioniert, beim Satz «wenn fahrt de nächscht Zug uf Lausanne vu Züri Oerlike us» oder «de nächscht Zug uf Muttenz» hingegen ist die Spracherkennung überfordert.
«Natural Speaking» – so wie uns der Schnabel gewachsen ist – ist deshalb nicht möglich. Bei Ortsnamen, die regional komplett anders ausgesprochen werden, beispielsweise «Buchsi» für «Herzogenbuchsee», kapituliert die Funktion ebenfalls.
Das muss nicht so bleiben, denn mit jeder gesprochenen Abfrage lernt der Dialekt-Erkennungs-Algorithmus hinzu. Wenn die Tester immer wieder «Buchsi» sagen und auf dem Folgebildschirm angeben, dass eigentlich «Herzogenbuchsee» gemeint ist, können die Macher der App dem Algorithmus die Bedeutung von «Buchsi» beibringen und ihn so in Zukunft die korrekte Zugverbindung heraussuchen lassen.
Datenbasis für Dialekt-Begriffe ist sehr klein
Für die Entwickler ist das automatisierte Sammeln von Dialekt-Begriffen via die 220'000 aktiven User der SBB-Preview-App eine grosse Erleichterung, weil sie sonst jeden einzelnen Begriff von Hand in einer speziellen computerlinguistischen Sprache in der Datenbank abbilden müssten.
Für die Schweizer Dialekte gibt es es im Gegensatz zur englischen oder deutschen Sprache kein Regelwerk und somit keine fundierte Datenbasis, auf welche die Programmierer zurückgreifen könnten.
Damit ihr Algorithmus überhaupt eine Grundlage besitzt, um die gängigsten Begriffe zu verstehen, sei er deshalb mit Dialekt-Wörtern aus Interviewaufnahmen zum Beispiel aus Fernsehsendungen und anderen Quellen der letzten Jahrzehnte gefüttert worden, erklärt Stephan Fellmann von Spitch. Ein grosse Herausforderung sei hier die Audioqualität der Aufnahmen und die demographische Verteilung der Sprecher.
Sprachaufenthalt für den Algorithmus
Man könne den Algorithmus im «Voice-Fahrplan» der SBB mit einem Menschen vergleichen, der in der Schule eine Fremdsprache gelernt habe, zum Beispiel Französisch, erklärt Fellmann weiter.
Vom Konzept her versteht die Person die Sprache. Im Gespräch mit Muttersprachlern dann aber trotzdem nicht immer – weil sich die Leute keine Mühe geben, zu schnell reden, regional Wörter anders aussprechen oder es zu laute Hintergrundgeräusche hat.
Bei einem Auslandsaufenthalt wird der Besucher zu Beginn noch kaum etwas verstehen, nach einigen Wochen aber immer mehr, weil er das Gefühl für die Besonderheiten entwickelt hat.
Was der «Sprach-Fahrplan» der SBB-Preview-App derzeit macht, ist also eigentlich nichts anderes als ein längerer Sprachaufenthalt im Ausland.