Die gängige Praxis: Bei der Entwicklung von Künstlicher Intelligenz werden zum Training der Programme riesige Datenmengen verarbeitet. Nur so kann der Textroboter ChatGPT dann auf fast alle Fragen eine Antwort liefern. Inzwischen mehren sich die Klagen von Autorinnen und Autoren von Texten und Werken aller Art gegen dieses Vorgehen.
Der Vorwurf an OpenAI : Die US-Komikerin Sarah Silverman und die Autoren Christopher Golden und Richard Kadrey werfen den ChatGPT-Entwicklern von OpenAI vor, ihre urheberrechtlich geschützten Werke ohne Einwilligung zum Trainieren von Künstlicher Intelligenz verwendet zu haben. Sie hatten zuvor von ChatGPT Zusammenfassungen ihrer Bücher angefordert. Dies gelang so gut, dass klar war: Die Bücher wurden von A bis Z kopiert – ohne Zustimmung, Quellenangabe und Vergütung.
Zusätzlich zu ihrer bei einem Gericht in Kalifornien eingereichten Klage gegen OpenAI gehen sie auch gegen den Facebook-Mutterkonzern Meta gerichtlich vor.
Das US-Urheberrecht und die flüchtige Kopie: Das US-Urheberrecht kennt das Prinzip des «Fair Use», also des fairen Nutzens, wie die auf Technologie- und Urheberrecht spezialisierte Juristin Martina Arioli erklärt: Es legt fest, wo die Gesellschaft einen Nutzen aus der schöpferischen Leistung anderer ziehen kann, ohne nachfragen zu müssen, ob das erlaubt oder kostenpflichtig ist. Das US-Urheberrecht sagt zugleich, dass auch ein «flüchtiges Kopieren» eines urheberrechtlich geschützten Werkes unter Umständen unter die «Fair-Use»-Doktrin fallen kann. Es kann also argumentiert werden, dass exakt eine solche «flüchtige Kopie» beim Data Training von KI erstellt werde. In der Schweiz gilt die Schranke des «Eigengebrauchs». Die kommerzielle Nutzung ohne Einwilligung bleibt grundsätzlich untersagt.
Mögliche Strategie von OpenAI : Arioli hält es für möglich, dass das beklagte Unternehmen OpenAI nun zum einen mit dem «Fair Use»-Prinzip argumentieren wird. Obwohl dies schwierig werden könnte, da im konkreten Fall ja einfach jeweils das gesamte Werk kopiert wurde und das Werk einen künstlerischen Wert hat. Zum anderen werde sich OpenAI möglicherweise auf den Standpunkt stellen, Datenbanken von Dritten benutzt zu haben, die eigentlich die urheberrechtlichen Fragen geklärt haben müssten. Auch in den Allgemeinen Geschäftsbedingungen spielt OpenAI den Ball weiter, indem sie Nutzerinnen und Nutzern sämtliche Rechte am In- und Output zuweist, solange sie sich an die Rechtsordnung halten. Ziemlich verwegen, findet Arioli, da die User keinen Einfluss darauf haben, welche Training-Data OpenAI für den Output überhaupt verwendet und auch keine transparenten Informationen darüber erhalten.
Chancen der Klägerschaft: Ein Erfolg der Klägerschaft vor Gericht könnte die Möglichkeiten von Technologie-Unternehmen einschränken, KI weiterzuentwickeln. Die Chancen von Urheberrechtsklagen in diesem komplexen System schätzt Expertin Arioli aber derzeit als eher gering ein. Insbesondere weil grundlegende Rechtsfragen im Zusammenhang mit «Text and data mining», dem Analyseverfahren aus unstrukturierten Texten und Datenströmen, noch nicht abschliessend beantwortet sind.
Die Forderung nach Transparenz: Der Anspruch an Transparenz sei grundsätzlich sinnvoll, es komme aber auf die konkreten Anforderungen an, so Arioli: Wenn verlangt werde, dass die Einwilligung jedes einzelnen Urhebers und jeder einzelnen Urheberin eingeholt werden müsste oder schon nur die einzelnen Werke und deren Urheberinnen und Urheber aufgelistet werden müssten, dürfte die Umsetzung scheitern. Ein KI-Modell funktioniere ja letztlich nur mit guten, aktuellen und umfassenden Training Data. Arioli verweist in diesem Zusammenhang auch auf die Diskussion um den AI-Act in der EU und die EU-Richtlinie über Urheberrecht im digitalen Binnenmarkt, der die Anbieter solcher Large Language Models (LLMs) oder Machine-Learning-Modelle zu Transparenz verpflichten möchte.