Das umstrittene Thema der KI-Urheberrechtsklagen gewinnt an Bedeutung, und viele befürworten, dass es höchste Zeit ist, dass KI-Unternehmen die riesigen Mengen an frei verfügbaren Daten, die ihre generativen Systeme gestärkt haben, entschädigen.
In einer jüngsten Welle von Rechtsstreitigkeiten ist in den Vereinigten Staaten und in Europa eine Vielzahl von Klagen entstanden, die eine Vergütung von KI-Unternehmen fordern. Die Prozessparteien reichen von einzelnen Autoren und Künstlern bis hin zu großen Medienkonglomeraten und äußern alle ihre Einwände gegen die Aneignung ihrer Werke durch KI zur Erzeugung minderwertiger Ableger.
Ein wirkungsvoller offener Brief der Autorengilde, mit über 8.500 Unterschriften von prominenten Schriftstellern wie Margaret Atwood, Dan Brown und Jodi Picoult, hat die Entwickler generativer KI-Anwendungen, darunter ChatGPT und Bard, aufgefordert, die unbefugte Nutzung literarischer Werke zu stoppen und eine angemessene Entschädigung zu leisten. Diese Autoren fordern eine Wiedergutmachung für die Daten, die „geerntet“ wurden, um diese KI-Systeme zu ernähren, und vergleichen dies mit einem unbezahlten Festmahl.

Autoren befürchten auch, dass die generative KI ihr Handwerk untergraben könnte, indem sie den Markt mit automatisierten Inhalten überschwemmt, die aus ihren Originalwerken abgeleitet werden. Diese Sorge wurde kürzlich deutlich, als Amazon eingreifen musste, um das Problem anzugehen, dass KI-generierte Bücher seine Bestseller-Charts überfüllen.
Bevor die Authors Guild Berufung einlegte, leiteten die Autoren Mona Awad und Paul Tremblay ein Gerichtsverfahren gegen OpenAI ein. Sie behaupteten eine Urheberrechtsverletzung mit der Begründung, dass die genauen Zusammenfassungen ihrer Bücher durch ChatGPT darauf hindeuteten, dass die KI auf ihr urheberrechtlich geschütztes Material trainiert worden sei. Sie sind in diesem Kampf nicht allein; Die Autorin und Komikerin Sarah Silverman hat ebenfalls eine Klage gegen OpenAI und Meta eingereicht und ihnen die unbefugte Vervielfältigung ihrer Autobiografie „The Bedwetter“ vorgeworfen. Allerdings könnten die Feinheiten der Funktionalität generativer KI die Rechtsgültigkeit dieser Behauptungen erschweren.
Es sind nicht nur Einzelpersonen, die sich in den Rechtsstreit einmischen. In einem bahnbrechenden Schritt positionierte sich die New York Times als erste große amerikanische Nachrichtenagentur, die eine Klage gegen OpenAI einreichte und die Verwendung von urheberrechtlich geschütztem Material bei der Ausbildung und Entwicklung von KI anfechtete.
KI-Urheberrechtsklagen: Der Grund dafür
Das aufkeimende Phänomen der KI-Urheberrechtsklagen ist ein Sinnbild für den wachsenden Widerstand gegen die unkontrollierte Nutzung urheberrechtlich geschützter Inhalte durch KI-Unternehmen. Während Plattformen wie ChatGPT mithilfe von Daten aus dem Internet entwickelt wurden, geschah dies ohne ausdrückliche Zustimmung der Ersteller dieser Daten. Bemerkenswert ist, dass die Schulung von GPT-3 eine Vielzahl von Quellen umfasste, darunter Wikipedia und Reddit. Bei diesem Prozess können unbeabsichtigt Teile urheberrechtlich geschützten Materials einbezogen werden, sodass diese umfangreichen Sprachmodelle urheberrechtlich geschützte Werke mit einem beunruhigenden Maß an Genauigkeit prägnant zusammenfassen können.

Das Problem verschärft sich, wenn man die rätselhafte Natur der KI bedenkt. Das „Black-Box“-Dilemma, bei dem das Innenleben der KI im Dunkeln bleibt, verstärkt die Befürchtungen, dass KI zum Sündenbock dafür werden könnte, dass sie sich sowohl bei der Entscheidungsfindung als auch bei der Generierung von Inhalten der Verantwortung entzieht.
Der rechtliche Einwand ergibt sich auch aus der Sorge, dass sich diese KI-Modelle als Inbegriff des Mittels zum Zweck erweisen könnten, wenn KI-Unternehmen diese undurchsichtigen Systeme weiterhin kommerzialisieren. Die Gefahr liegt in einer potenziellen Zukunft, in der Entscheidungen nicht wegen ihrer Wirksamkeit oder Genauigkeit KI-Systemen anvertraut werden, sondern weil sie die rechtlichen und ethischen Beschränkungen umgehen können, die menschliches Handeln binden.
Datenquellen und Methoden
Bei der KI-Entwicklung, insbesondere bei generativen KI-Modellen, wie sie im Mittelpunkt zahlreicher Rechtsstreitigkeiten stehen, ist der Prozess der Datenerfassung ein entscheidender und umstrittener Aspekt. Die Methoden und Quellen, aus denen diese KI-Systeme ihre Trainingsdaten beziehen, haben erhebliche rechtliche und ethische Auswirkungen, insbesondere wenn es sich um urheberrechtlich geschütztes Material handelt.
Generative KI-Modelle wie GPT-3 oder ChatGPT werden auf riesigen Datensätzen trainiert, die aus verschiedenen Online-Quellen gesammelt werden. Zu diesen Quellen gehören häufig öffentliche Websites wie Wikipedia und Reddit, können aber auch umstrittenere Repositories wie Schattenbibliotheken oder andere Plattformen umfassen, auf denen urheberrechtlich geschütztes Material leicht verfügbar ist. Die Schulung umfasst nicht nur einfaches Data Scraping, sondern auch komplexe Prozesse zum Verständnis von Kontext, Stil und Inhaltsnuancen.

Die rechtliche Grauzone
Die rechtliche Unklarheit entsteht dadurch, dass die Daten zwar öffentlich zugänglich sind, die Nutzungsrechte jedoch nicht immer klar sind. Inhalte aus einem öffentlichen Forum dürfen beispielsweise ihre Verwendung zum Training von KI nicht ausdrücklich verbieten, gewähren aber auch keine Erlaubnis. Diese Grauzone hat zu zahlreichen KI-Urheberrechtsklagen geführt, in denen Kläger argumentieren, dass ihre geistigen Eigentumsrechte durch die Aufnahme ihrer Arbeit in KI-Trainingssets ohne Zustimmung oder Entschädigung verletzt wurden.
Wie verletzt KI die Menschenrechte?
KI-Technologien sind zwar revolutionär, werden aber zunehmend auf mögliche Menschenrechtsverletzungen untersucht, eine Sorge, die im Zusammenhang mit KI-Urheberrechtsklagen noch verstärkt wird.
Zu den wichtigsten Themen gehören:
- Die Fähigkeit der KI zur umfassenden Datenerfassung und -überwachung kann die Privatsphäre des Einzelnen verletzen.
- KI-Systeme können in ihren Trainingsdaten vorhandene Vorurteile aufrechterhalten, was zu diskriminierenden Ergebnissen in verschiedenen Sektoren führt, was die Besorgnis in laufenden KI-Urheberrechtsklagen unterstreicht.
- Die durch KI gesteuerte Moderation von Inhalten kann unbeabsichtigt die freie Meinungsäußerung unterdrücken, ein Problem, das sich mit den Debatten über geistiges Eigentum in KI-Urheberrechtsklagen überschneidet.
- Im juristischen Umfeld können KI-Tools die Entscheidungsfindung beeinflussen und möglicherweise die Fairness von Gerichtsverfahren und Gerichtsverfahren beeinträchtigen.
- Die KI-gesteuerte Automatisierung stellt die Arbeitnehmerrechte aufgrund der Arbeitsplatzverlagerung und der Notwendigkeit einer Anpassung der Belegschaft vor Herausforderungen.
- Der ungleiche Zugang und die Auswirkungen von KI können bestehende Ungleichheiten verschärfen, eine Sorge, die mit den gleichberechtigten Zugangs- und Nutzungsrechten einhergeht, die im Mittelpunkt von Urheberrechtsklagen gegen KI stehen.
- KI-Systeme, die das Nutzerverhalten manipulieren, werfen Fragen zur individuellen Autonomie und Einwilligung auf.
- Die Kontrolle der KI über die Informationsverbreitung kann das Recht der Öffentlichkeit auf Zugang zu vielfältigen und unvoreingenommenen Informationen beeinträchtigen.
Der Kampf der Künstler um Urheberrechte gegen KI steht vor einem harten Kampf
Welche Klagen gibt es gegen KI?
Auf dem juristischen Gebiet wimmelt es derzeit von KI-Urheberrechtsklagen, wobei mehrere Fälle das Spannungsverhältnis zwischen generativen KI-Unternehmen und Urheberrechtsnormen verdeutlichen. Zu den Prozessparteien gehören verschiedene Unternehmen, die in diese hochriskanten Rechtsstreitigkeiten verwickelt sind.
Google: Klage wegen Datensammlung
Google steht vor einer Sammelklage Sie werfen dem Technologieriesen Missbrauch personenbezogener Daten und Urheberrechtsverletzungen vor. Den Vorwürfen zufolge hat Google Daten gesammelt, darunter Bilder von Dating-Sites, Spotify-Playlists, TikTok-Videos und Literatur, die zur Verfeinerung von Bard verwendet wurden. Die im Juli 2023 eingereichte Klage deutet darauf hin, dass Google für Schäden von mehr als 5 Milliarden US-Dollar haftbar sein könnte. Die Kläger entscheiden sich für Anonymität und vertreten eine wachsende Sorge um die Privatsphäre und Eigentumsrechte.
Diese Flut von Klagen wegen Urheberrechtsklagen gegen KI ist nicht ohne Präzedenzfall. Der Fall der Author’s Guild gegen Google im Jahr 2015 setzte einen bedeutenden rechtlichen Maßstab. Die Gilde stellte Googles Digitalisierung von Millionen von Büchern in Frage und bot Ausschnitte online an. Das Urteil begünstigte Google und bezeichnete die Nutzung als transformativ und nicht konkurrenzfähig zum ursprünglichen Markt für die Bücher.
OpenAI: Urheberrechtsprobleme
Auch OpenAI ist in den Rechtsstreit eingestiegen, wobei die Autoren Paul Tremblay und Mona Awad Urheberrechtsverletzungen geltend machen. Ihr Anwalt Butterick vertritt eine breitere Kohorte von Autoren, deren Werke ihrer Behauptung nach in den umfangreichen Trainingsdaten von OpenAI repliziert wurden, die möglicherweise über 300.000 Bücher umfassen. Die im Juni 2023 eingereichte Klage fordert eine nicht genannte Schadensersatzsumme.

OpenAI und Microsoft: NYT-Klage
Darüber hinaus die New York Times ist gestartet eine Klage sowohl gegen OpenAI als auch gegen Microsoft. In der Einreichung vom Dezember 2023 wird behauptet, dass OpenAI Millionen von Times-Artikeln genutzt habe, um ihre Sprachmodelle zu trainieren, die nun der Veröffentlichung bei der Bereitstellung zuverlässiger Informationen Konkurrenz machen. Darüber hinaus wird in der Klage behauptet, dass die Modelle von OpenAI nicht nur den einzigartigen Stil der Times widerspiegeln, sondern auch deren Inhalt wörtlich wiedergeben. Die Times, eine Premiere für eine große amerikanische Nachrichtenagentur, führte Anfang des Jahres Diskussionen über die Urheberrechtsfrage fort, jedoch ohne Erfolg, was in diesem bahnbrechenden Rechtsstreit gipfelte.
Meta und OpenAI: Der Fall Silverman
Die Klage der Komikerin Sarah Silverman gegen Meta und OpenAI bringt Vorwürfe einer Urheberrechtsverletzung ans Licht. Sie geht davon aus, dass sowohl ChatGPT als auch das Large Language Model (Llama) von Meta AI unter Verwendung rechtswidrig beschaffter Daten entwickelt wurden, die ihre Arbeit beinhalteten. Die Klage weist auf „Schattenbibliotheken“ wie Library Genesis, Z-Library und Bibliotek hin, die für die gemeinsame Nutzung von Inhalten auf Torrent-Basis berüchtigt sind, die häufig ohne gesetzliche Genehmigung erfolgt. Konkret heißt es in dem Fall, dass Metas Lama durch einen Datensatz namens „Pie“ informiert wurde. zusammengestellt von EleutherAI, das angeblich Daten von Bibliotek enthält. Diese Klage wurde im Juli 2023 eingereicht.

GitHub, Microsoft und OpenAI: Die Copilot-Kontroverse
Eine kollektive KI-Urheberrechtsklage richtet sich gegen GitHub, Microsoft und OpenAI im Zusammenhang mit dem Copilot-Tool. Dieser KI-gestützte Dienst vervollständigt Codeausschnitte automatisch, indem er aus den Eingaben eines Programmierers lernt. Die Kläger argumentieren, dass Copilot rechtswidrig Code aus den Repositories von GitHub wiedergibt und dabei die Lizenzanforderungen, einschließlich der ordnungsgemäßen Namensnennung, missachtet. Über die Urheberrechtsbeschwerden hinaus wirft die Klage GitHub auch Missmanagement und Betrug bei personenbezogenen Daten vor. Der im November 2022 eingereichte Fall wurde von Microsoft und GitHub wiederholt abgewiesen.
Stabilitäts-KI, Midjourney und DeviantArt: Der Streit um künstlerische Integrität
Im Januar 2023 sah a Klage gegen Hersteller von KI-Bildgeneratoren Stabilitäts-KI, Midjourney und DeviantArt. Die Kläger behaupten, dass diese Plattformen Urheberrechte verletzen, indem sie auf den Werken der Kläger trainieren und Ableitungen davon erstellen. Darüber hinaus gibt es Meinungsverschiedenheiten über die Fähigkeit dieser Tools, die Stile bestimmter Künstler zu reproduzieren. Der vorsitzende Richter William Orrick äußerte vorläufig die Absicht, die Klage abzuweisen.

Stabilitäts-KI: Die Klagen von Getty Images
Die Doppelklagen von Getty Images gegen Stability AI werfen ein Schlaglicht auf das unbefugte Kopieren und Verarbeiten unzähliger Bilder und zugehöriger Metadaten, an denen Getty im Vereinigten Königreich Rechte besitzt. Eine nachfolgende Klage vor dem US-Bezirksgericht für den Bezirk Delaware weist auf ähnliche Urheberrechts- und Markenrechtsverletzungen hin. Es unterstreicht auch die Besorgnis über „bizarre oder groteske“ Bilder, die mit dem Getty-Wasserzeichen erstellt wurden und möglicherweise den Ruf des angesehenen Bildspeichers schädigen. Diese rechtlichen Schritte wurden gemacht im Januar 2023.
Schlüsselfragen, die diese KI-Urheberrechtsklagen aufwerfen
Das Aufkommen von Urheberrechtsklagen gegen KI signalisiert einen Wandel in unserer Sicht auf digitale Kreativität. Diese hochkarätigen rechtlichen Auseinandersetzungen werfen mehrere Schlüsselfragen auf, die das Urheberrecht in Bezug auf generative KI neu definieren könnten:
- Lizenzierung von KI-Schulungsmaterialien: Ist eine Lizenzierung erforderlich, wenn KI-Modelle auf urheberrechtlich geschützten Inhalten trainiert werden? Angesichts der Tatsache, dass generative KI-Systeme die Schulungsmaterialien während ihrer Lernphase replizieren, hängt die rechtliche Debatte davon ab, ob diese Replikation unter die faire Nutzung fällt oder eine formelle Lizenzierung erfordert.
- Urheberrechtsverletzung und KI-Ausgaben: Verletzen die Ergebnisse der generativen KI die Urheberrechte der im Training verwendeten Materialien? Ein wichtiger Aspekt für die Gerichte ist die Frage, ob die Ähnlichkeiten zwischen den KI-Ausgaben und den Trainingsdaten auf geschützten oder nicht geschützten Inhalten beruhen. Darüber hinaus ist die Frage, wer für Urheberrechtsverletzungen durch ein KI-System verantwortlich ist, noch nicht geklärt.
- Einhaltung der Gesetze zum digitalen Urheberrecht: Verstoßen generative KI-Technologien gegen Gesetze, die die Änderung oder Entfernung von Informationen zur Urheberrechtsverwaltung regeln? Dieses Problem ist besonders relevant im Fall gegen Stability AI, wo KI-generierte Bilder falsche Informationen zur Urheberrechtsverwaltung enthielten, wie z. B. reproduzierte Wasserzeichen.
- Publizitätsrecht und KI: Verletzt die Schaffung von KI-generierten Werken, die den Stil einer bestimmten Person nachahmen, deren Recht auf Veröffentlichung? Dieses Recht, das von Staat zu Staat unterschiedlich ist, schränkt die Verwendung des Abbilds, des Namens, des Bildes, der Stimme oder der Unterschrift einer Person für kommerzielle Zwecke ohne Zustimmung ein.
- Open-Source-Lizenzen und KI: Wie überschneiden sich Open-Source-Lizenzen mit der Schulung und Verbreitung von KI-generierten Inhalten? Dies ist ein zentrales Anliegen in der Klage gegen GitHub Copilot, in der die Kläger argumentieren, dass das Versäumnis, das Quellmaterial zu nennen und Copilot als Open Source freizugeben, gegen die Bedingungen der Open-Source-Lizenzierung verstößt.
Während diese KI-Urheberrechtsstreitigkeiten voranschreiten und Antworten bieten, sollten Unternehmen, die an der Entwicklung und dem Einsatz generativer KI-Tools beteiligt sind, auf neue Richtlinien im Zusammenhang mit KI und geistigem Eigentum achten. Es kann für diese Unternehmen auch ratsam sein, Strategien zur Minderung potenzieller Risiken in diesem sich wandelnden rechtlichen Umfeld in Betracht zu ziehen. KI-Urheberrechtsklagen verdeutlichen die Notwendigkeit klarer Richtlinien zur Datennutzung und -rechte.
Hervorgehobener Bildnachweis: Igor Omilaev/Unsplash