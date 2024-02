Video aus Text: Die Technik ist nicht neu, aber sie war noch nie so ausgereift wie in der neuen OpenAI-Software «Sora».

Kaum eine Technik bringt derzeit die Gemüter derart in Wallung wie die Leistungen der Künstlichen Intelligenz (KI). Letzter Streich der durch den Chatbot ChatGPT zu Ruhm gelangten Firma OpenAI ist die Text-zu-Video-KI-Software «Sora». Wir sagen Ihnen, was Sie wissen müssen. Und ob Sie sich zu fürchten brauchen.

Die Software: Das KI-Modell mit dem Namen «Sora» werde zunächst ausgewählten Kreativen zur Verfügung gestellt, schreibt OpenAI-Chef Sam Altman auf X. Auch sollen Experten mögliche Sicherheitsrisiken ausloten, bevor das Programm breit genutzt werden kann. In der vorliegenden Version können mit bereits wenigen textlichen Vorgaben erstaunlich konsistente Videos erstellt werden. Von Sora erstellte Videos können bis zu einer Minute lang sein.

Auf der Website zur Software veröffentlichte OpenAI mehrere Beispiele zusammen mit der Beschreibung, die ihnen zugrunde lag. Eines davon zeigt eine Frau, die auf einer Strasse läuft. Das Video wurde komplett von Künstlicher Intelligenz generiert, mit der Textvorgabe, die Frau solle eine Lederjacke und ein rotes Kleid tragen und die Strasse solle an Tokio erinnern und viel Neon-Leuchtreklame haben, die sich zudem in Pfützen spiegele. Für den Leiter von SRF-Digital, Guido Berger, ist «Sora» aus Expertensicht «nichts Überraschendes». An der Technik, die in Sora verbaut sei, werde schon lange gearbeitet.

Die Qualität der Software: Die Resultate von «Sora» sind laut Berger aber dennoch «magisch» und sähen sehr gut aus. Beeindruckend sei beispielsweise, wie geschmeidig die Software zwei verschiedene Videos zu einem neuen Clip zusammenfügen könne. Im Gegensatz zu anderen Text-zu-Video-KIs gelinge es OpenAI, die einzelnen Bilder innerhalb eines Videos so zu gestalten, dass bewegende Objekte sich von Bild zu Bild kaum mehr verändern würden. Das unterscheide «Sora» von bisherigen Modellen.

Allerdings sei die zugrundeliegende Technik auch anderen Unternehmen bekannt, sodass Berger damit rechnet, dass beispielsweise auch Google bald auf dem Niveau von «Sora» sein werde. OpenAI selbst räumt aber noch gewisse Kinderkrankheiten des Programms ein.

Guido Berger Leiter SRF Digital Personen-Box aufklappen Personen-Box zuklappen Guido Berger erklärt Technologie und Games fürs Schweizer Radio und Fernsehen und produziert mit seinem Team den Podcast SRF Digital.

So mache das Modell manchmal Fehler bei der Umsetzung von Physik-Regeln. Auch könne es zum Beispiel passieren, dass jemand im Video von einem Keks abbeisse – und der Keks später immer noch ganz aussehe.

Die Chancen und Risiken von «Sora»: KI-Technologie, die bewegte Bilder aus Textvorgaben generiert, wird mit der Zeit die Videoproduktion verändern. Zugleich sind die Sorgen gross, dass damit in grossem Stil Fake-Videos erzeugt werden können, die von echten Aufnahmen kaum zu unterscheiden sind. Die Entwickler der Technologie arbeiten deshalb an Wegen, in die Videos eindeutige Erkennungsmerkmale wie Wasserzeichen einzubauen. Auch bei Sora-Videos solle erkennbar sein, dass sie von KI erzeugt wurden, schreibt das Unternehmen.

SRF-Digital-Leiter Guido Berger hält nichts von übertriebenem Alarmismus. Schon vor OpenAI habe man Fotos und Videos nicht uneingeschränkt vertrauen können. Insofern sei «Sora» nichts qualitativ Neues, sondern vor allem quantitativ. Man könne jetzt viel grössere Mengen an Videomaterial künstlich herstellen, und das könnte Faktenchecker über die Massen fordern. Andererseits birgt die Technik auch viele Vorteile, so Berger. Mit «Sora» liessen sich filmische Welten erschaffen, für die es früher kostspielige Studiotechnik brauchte.