Zum Inhalt springen

Header

Video
Die Medienfalle: Gefährliche Bild- und Tonfälschungen
Aus Kassensturz vom 21.11.2017.
abspielen. Laufzeit 4 Minuten 40 Sekunden.
Inhalt

«Kassensturz»-Spezial Die Medienfalle: Gefährliche Bild- und Tonfälschungen

Aussagen von Präsidenten in Bild und Ton können die Welt verändern. Doch was, wenn sie das, was man sie sagen hört und sieht, gar nie gesagt haben? «Kassensturz» zeigt, wie mit intelligenter Software Stimme und Mimik einer Person in Echtzeit gefälscht werden können.

Es ist ein seltsames Bild: Neben «Kassensturz»-Moderator Ueli Schmezer steht sein digitales Double – sein Avatar. Dieser ist zwar etwas ungelenk, aber eine gewisse Ähnlichkeit ist nicht abzustreiten.

Der Digitaltag

Box aufklappen Box zuklappen
Legende: srf

Das war der Digitaltag bei SRF.

Zusammengesetzt wurde das Ueli-Schmezer-Double von Patrick Arnecke. Er ist Leiter der Abteilung Design bei SRF und erklärt: «Das Äussere haben wir mit Fotos von Ueli Schmezers Gesicht und mit einem Körper aus unserer Körper-Bibliothek zusammengesetzt. Mit Stimmaufnahmen von Ueli Schmezer konnten wir dann die Lippenbewegungen des virtuellen Doppelgängers steuern.»

So ganz realistisch sieht der Avatar nicht aus. Die Designer haben auch nur wenige Tage in diesen Versuch investiert. Tatsache ist aber, dass es noch viel besser und echter geht.

Jede Stimme kann imitiert werden

Patrick Arnecke stellt die Software einer kanadischen Firma vor. Die Firma verspricht, jede Stimme imitieren zu können. «Dazu braucht man lediglich eine Audio-Aufnahme von einer Minute. Damit können Profis die Software trainieren, sodass diese mit dieser Stimme völlig neue Texte erzeugen kann», so Arnecke.

Das lädt zu Missbrauch ein. Hier ein Beispiel mit Hillary Clinton, Barack Obama und Donald Trump. Ihnen wurden Worte in den Mund gelegt, die sie so sicher nie sagen würden:

Video
Imitierte Stimmen von amerikanischen Politikern
Aus Kassensturz vom 21.11.2017.
abspielen. Laufzeit 10 Sekunden.

Und es geht noch schlimmer: Forscher haben die Technik Face-to-Face entwickelt. Mit deren Hilfe manipuliert man die Mimik in Videoaufnahmen.

Bush wird unfreiwillig zum Gesichtsakrobaten

Ein Beispiel: Unten links im Video befindet sich die Originalaufnahme von George W. Bush. Oben links überträgt ein Forscher seine Mimik auf das Gesicht des Ex-Präsidenten. Rechts dann das Resultat: Ein ferngesteuerter George W. Bush.

Video
Bush als Mimik-Akrobat
Aus Kassensturz vom 21.11.2017.
abspielen. Laufzeit 3 Minuten 8 Sekunden.

Der nächste Schritt: Mimik-Steuerung allein durch die Stimme

Die Entwicklung macht allerdings nicht Halt. Eine andere Forschergruppe hat ein Programm entwickelt, das ohne einen Mimen auskommt. Für die Steuerung des Gesichts braucht es lediglich eine Tonaufnahme. Die Mimik wird dann allein durch diese Stimmaufnahme gesteuert.

Ein Beispiel dazu liefert dieses Video mit Barack Obama. Die Fälschung rechts im Bild ist alleine gesteuert durch die Stimme des Originalvideos links.

Video
ZWEIER OBAMA
Aus Kassensturz vom 21.11.2017.
abspielen. Laufzeit 38 Sekunden.

Beunruhigend: Bereits mit geringem Aufwand können Fälschungen in grossem Massstab hergestellt werden. Glücklicherweise gibt es Software, die solche Fälschungen entlarven kann. Und auch Experten können feststellen, ob es sich bei Videos um eine Fälschung handelt.

Eine gesunde Portion Skepsis

Doch das hilft wenig, weiss Digital-Experte Patrick Arnecke: «Der angerichtete Schaden ist meist schon sehr gross, bevor nachgewiesen wird, dass eine Manipulation vorliegt. Das Video hat sich bereits über die sozialen Medien verbreitet und der Ruf ist ruiniert.» Das einzige, was wirklich hilft, ist eine gesunde Portion Skepsis.

Meistgelesene Artikel