«Wann ist Ihr Geburtstag?» «Was ist Ihr Kontostand?» «Welche Daueraufträge gibt es auf Ihrem Konto?» «Wer hat alles Zugriff?». Wer seine Bank anruft, kommt in der Regel nicht drum herum, zur Identifizierung persönliche Fragen zu beantworten.
Automatische Stimmerkennung statt Fragerei
Immer mehr Schweizer Finanzinstitute verzichten auf diese Fragerei. Sie haben ihr Callcenter mit einem Stimmerkennungs-Programm ausgerüstet: Die Kunden am Telefon werden durch die Stimme identifiziert: Ist diese im System gespeichert und dem entsprechenden Kunden zugeordnet, erkennt das Programm sie beim nächsten Anruf automatisch. Das spart Zeit – wirft aber auch Fragen bezüglich Sicherheit und Datenschutz auf.
Menschliche Stimme hat 500 verschiedene Merkmale
Wie funktioniert Stimm-Biometrie überhaupt? Zuerst hinterlegt die Person einen Stimmabdruck – sie spricht ein paar Sätze, fertig. Später, am Telefon mit der Bank, schildert die Kundin ihr Anliegen: Währenddessen wird ihre Stimme im Hintergrund mit dem hinterlegten Profil verglichen.
Das SRF-Konsumentenmagazin «Espresso» lässt eine Stimmerkennungs-Software bei der Schweizer Firma Spitch in Zürich zeigen. Diese entwickelt Programme zur Stimm- und Spracherkennung für Finanzinstitute, aber auch für Polizeien und Call-Center.
Entspricht die Stimme am Telefon dem hinterlegten Stimmabdruck, wechselt die Kurve auf Grün. Gibt die Person den Telefonhörer während des Gesprächs einer anderen Person, merkt das die Software und stellt auf Rot. Missbrauch sei praktisch ausgeschlossen, sagt Stephan Fehlmann von Spitch.
Auch eineiige Zwillinge werden erkannt
Die menschliche Stimme sei einzigartig und unverwechselbar wie ein Fingerabdruck. Rund 500 charakteristische Merkmale habe eine Stimme, wie Stimmlage, -frequenz oder die Pausen zwischen den Wörtern und Buchstaben.
Jeder menschliche Rachen ist etwas anders gebaut. Auch jener von eineiigen Zwillingen.
«Jeder menschliche Rachen ist etwas anders gebaut. Auch jener von eineiigen Zwillingen.» sagt Fehlmann. Den Stimmabdruck könne man auch nicht kopieren und missbrauchen, meint er. Die Stimmaufnahme der Kunden werde durch eine mathematische Formel ersetzt und die Audiodatei danach gelöscht.
Lässt sich das Programm austricksen?
Ob sich das Programm überlisten lässt, probiert «Espresso» aus. «Espresso»-Moderatorin Martina Schnyder macht zum Test einen Stimmabdruck. Danach versuchen wir, ihr fiktives Bankkonto mit der Stimme der ehemaligen «10vor10»-Moderatorin Daniela Lager zu knacken, die wir ab dem Handy einspielen.
Die Aufnahmen für den Versuch
Vergeblich. Der Computer erkennt den Bluff. Und auch mit einer Tonbandaufnahme von Martina Schnyder selber kommen wir nicht weiter. Der Grund: Tonaufnahmen werden stark komprimiert und weisen nicht mehr den gleich grossen Stimmumfang auf wie eine Live-Stimme am Telefon.