Laut einer erweiterten Sammelklage haben NVIDIA-Führungskräfte die Verwendung von Millionen Raubkopien von Büchern aus Annas Archiv für KI-Schulungen genehmigt. In der Klage wird unter Berufung auf interne NVIDIA-Dokumente behauptet, das Unternehmen habe Anna's Archive kontaktiert, um einen Hochgeschwindigkeitszugriff auf seine Daten zu erhalten. NVIDIA hat vom Boom der künstlichen Intelligenz profitiert und der Umsatz stieg aufgrund der hohen Nachfrage nach seinen KI-Lernchips und Rechenzentrumsdiensten. NVIDIA entwickelt eigene KI-Modelle, darunter NeMo, Retro-48B, InstructRetro und Megatron. Diese Modelle werden mithilfe von NVIDIA-Hardware und großen Textbibliotheken trainiert, ähnlich wie bei anderen Technologieunternehmen. Das Unternehmen wurde wegen seiner Schulungsmethoden von Urheberrechtsinhabern rechtlich angefochten. Die Autoren verklagten NVIDIA erstmals Anfang 2024 wegen Urheberrechtsverletzung und behaupteten, die KI-Modelle des Unternehmens seien auf dem Books3-Datensatz trainiert worden, der ohne Erlaubnis urheberrechtlich geschützte Werke von Bibliotik enthielt. NVIDIA verteidigte sein Vorgehen als faire Nutzung und erklärte, dass Bücher statistische Korrelationen zu seinen KI-Modellen darstellen. Bei der Entdeckung tauchten jedoch neue Beweise auf. Die Kläger reichten letzten Freitag eine geänderte Klage ein und erweiterten den Umfang der Klage durch die Hinzufügung weiterer Bücher, Autoren und KI-Modelle. Die geänderte Beschwerde umfasst umfassendere „Schattenbibliothek“-Ansprüche. Autoren, darunter Abdi Nazemian, zitieren nun interne E-Mails und Dokumente von NVIDIA und behaupten, das Unternehmen habe bereitwillig Millionen urheberrechtlich geschützter Bücher heruntergeladen. In der Beschwerde wird behauptet, dass „der Wettbewerbsdruck NVIDIA zur Piraterie getrieben hat“, was eine Zusammenarbeit mit Anna's Archive beinhaltet. Der geänderten Beschwerde zufolge kontaktierte ein Mitglied des Datenstrategieteams von NVIDIA Anna's Archive, um sich über den Erwerb seiner Raubkopienmaterialien für das Vortraining großer Sprachmodelle, darunter Anna's Archive, zu erkundigen. In der Beschwerde heißt es, Anna's Archive habe Zehntausende Dollar für den „Hochgeschwindigkeitszugriff“ auf seine Sammlungen verlangt und NVIDIA habe Einzelheiten zu diesem Zugriff eingeholt. In der Beschwerde wird behauptet, Anna's Archive habe NVIDIA gewarnt, dass seine Bibliotheksinhalte illegal erworben und verwaltet würden. Berichten zufolge hat Anna's Archive die Führungskräfte von NVIDIA um eine interne Genehmigung zum Fortfahren gebeten, die innerhalb einer Woche erteilt wurde. Nachdem Anna's Archive die Erlaubnis des NVIDIA-Managements erhalten hatte, gewährte es Zugang zu seinen Raubkopien. Anna's Archive bot NVIDIA Zugriff auf etwa 500 Terabyte an Daten, darunter Millionen von Büchern, die normalerweise über das digitale Leihsystem von Internet Archive erhältlich sind. In der Beschwerde wird nicht angegeben, ob NVIDIA Anna's Archive bezahlt hat. NVIDIA wird auch vorgeworfen, neben der Books3-Datenbank auch andere Raubkopien verwendet zu haben, darunter LibGen, Sci-Hub und Z-Library. Die Autoren behaupten, NVIDIA habe nicht nur Raubkopien von Büchern für sein KI-Training heruntergeladen und verwendet, sondern auch Skripte und Tools verteilt, die es Unternehmenskunden ermöglichten, „The Pile“ herunterzuladen, das den raubkopierten Books3-Datensatz enthält. Diese Anschuldigungen führen zu neuen Behauptungen über mittelbare und mittelbare Rechtsverletzungen und behaupten, NVIDIA habe Einnahmen von Kunden erzielt, indem es den Zugriff auf diese Raubkopien von Datensätzen erleichtert habe. Die Autoren fordern Schadensersatz für die genannten Autoren und möglicherweise für Hunderte andere, die sich der Sammelklage anschließen. Diese Enthüllung markiert die erste öffentliche Offenlegung der Korrespondenz zwischen einem großen US-amerikanischen Technologieunternehmen und Anna's Archive. Die erste konsolidierte und geänderte Beschwerde, abgelegt am US-Bezirksgericht für den nördlichen Bezirk von Kalifornien nennt die Autoren Abdi Nazemian, Brian Keene, Stewart O'Nan, Andre Dubus III und Susan Orlean.




