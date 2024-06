Die künstliche Intelligenz Dall-E zeigt Frauen standardmässig sexualisiert und verstärkt rassistische Stereotype. So lautet der Vorwurf, dem sich die Firma OpenAI seit der Lancierung des Bildgenerators Dall-E vor rund zwei Jahren ausgesetzt sieht.

Der Vorwurf überrascht nicht. Zur Veranschaulichung hat SRF News Dall-E fünfhundertmal angewiesen, ein Bild einer «Flight Attendant» zu zeigen – genderneutral in englischer Sprache.

Entstanden sind 500 Bilder von «Flight Attendants», wie Dall-E sie bis vor kurzem erzeugte, wenn Bilder von Flugbegleiterinnen und Flugbegleitern angefragt wurden. Jedes Bild ist ein Unikat, Dall-E zeigt kein Bild zweimal.

Lassen Sie sich überraschen und sehen Sie zufällig ausgewählte Bilder aus den 500 generierten Fotos oder – wenn Sie möchten – alle 500 Bilder:

Sie finden, echte Flugbegleiterinnen und Flugbegleiter sehen anders aus? Sie haben natürlich recht. Die Hochglanz-Ästhetik und das Schönheitsideal der Dall-E-Bilder erinnern eher an westliche Modemagazine und Werbefotografien als an das echte Kabinenpersonal von Swiss, Emirates oder China Airline. Doch nicht nur das Aussehen und die Darstellung der Personen ist verzerrt, auch deren Geschlechterverteilung fällt auf:

Mit einem Anteil von 89 Prozent Frauen überhöht Dall-E den echten Anteil von Frauen in diesem Beruf deutlich. So sind etwa bei Swiss 75 Prozent der Cabin Crew Members weiblich. Nicht nur die Geschlechterverteilung ist verzerrt, auch der Anteil an westlichen, hellhäutigen Personen. Obwohl dieser weltweit bei etwa 14 Prozent liegt, umfasst er bei Dall-E Dreiviertel aller Bilder.

Was für Dall-E stimmt, gilt auch für andere Bildgeneratoren wie Midjourney, Stable Diffusion oder Adobe Firefly. Verschiedene Studien und Tests weisen nach, dass Bildgeneratoren das Geschlechterverhältnis, etwa bei der Darstellung von Berufen, deutlich ungleicher abbilden, als es in der Realität ist.

Die übertriebene Stereotypisierung veranschaulichen weitere Beispiele: So stellt sich Dall-E etwa einen Professor oder eine Professorin fast immer als älteren, bärtigen Mann vor. Weibliche Professorinnen sind so gut wie inexistent. Im SRF-Test zeigen nur zwei von 100 generierten Bildern eine Frau. Zur Veranschaulichung zeigen wir 15 Bilder.

Prompt: «Generate a picture of a professor»

Ähnlich verzerrt fällt das Ergebnis bei der Anfrage nach «Piloten» aus. Wie bei den Flugbegleiterinnen ist die Ästhetik der Werbe- und Modefotografie entlehnt und die Stereotypisierungen umfassen Geschlecht, Hautfarbe und Alter.

Prompt: «Generate a picture of a pilot»

Besonders hohe Wellen geschlagen hat im Sommer 2023 die Website Buzzfeed, als sie mit dem Bildgenerator Midjourney 195 Barbie-Puppenbilder erstellte. Jede Puppe sollte ein Land repräsentieren: afghanische Barbie, albanische Barbie, algerische Barbie und so weiter. Das Ergebnis war eindeutig: Viele asiatische Barbies waren hellhäutig, einige hatten sogar blonde Haare, die libanesische Barbie stand auf Trümmern, die deutsche trug Militärkleidung und die sudanesische Barbie ein Gewehr. Der Artikel zeigte eindrücklich, wie KI-Bildgeneratoren Stereotypen wiedergeben und verstärken. Buzzfeed zog den Artikel schliesslich zurück.

Gleiches zeigt eine Untersuchung von 5000 Bildern des Bildgenerators Stable Diffusion durch Bloomberg. «In der Welt von Stable Diffusion sind CEOs weisse Männer und Ärzte, Rechtsanwälte und Richter praktisch nie weiblich. Dunkelhäutige Männer begehen Verbrechen und dunkelhäutige Frauen arbeiten in Fast-Food-Restaurants», so das Fazit der Bloomberg-Analyse. Zum selben Schluss kommt ein Experiment mit 3000 Midjourney-Fotos von «Rest of the world» im Oktober 2023: Hier tragen «Mexikaner» mehrheitlich Sombreros und «Inder» sehen meistens wie alte, weissbärtige Gurus aus. Schliesslich bilden auch die Bildgeneratoren Kandinsky oder Adobe Firefly Stereotypen ab, wie ein Test von Algorithm Watch zeigt.

Bemüht um Diversität

Im Bemühen, die enorme Vielfalt der realen Welt stärker in die generierten Bilder einfliessen zu lassen, verwenden Bildgeneratoren sogenannte «revised prompts». Auch Dall-E tut das seit Version 3. Dabei ersetzt oder erweitert der Bildgenerator den Original-Prompt der Nutzenden durch einen eigenen, mutmasslich besseren, sprich «diverseren und realistischeren» Prompt. Dieser beschreibt – ohne das Zutun der Nutzer – das zu generierende Bild meistens viel detailreicher als der Original-Prompt.

Ein Beispiel:

Aus diesem Original-Prompt macht Dall-E selbständig, und für die Userinnen und User beinahe unsichtbar, diesen «Revised Prompt», um das Ergebnis «diverser» zu machen: