Das Internetarchiv hat einen wichtigen Rechtsstreit verloren, nachdem das US-Berufungsgericht eine Urteil in Hachette v. Internet Archive, in dem es feststellte, dass seine Praktiken zur Digitalisierung und Ausleihe von Büchern gegen das Urheberrecht verstoßen. Der Fall ging auf die Initiative des Archivs zur National Emergency Library während der Pandemie zurück, die eine uneingeschränkte digitale Ausleihe von Büchern ermöglichte und damit Gegenreaktionen von Verlagen und Autoren auslöste. Das Gericht lehnte die Fair-Use-Verteidigung des Archivs ab, obwohl es dessen gemeinnützigen Status anerkannte. Dieses Urteil stärkt die Kontrolle von Autoren und Verlagen über ihre Werke. Aber es erinnert mich sofort daran, wie KI-Tools Daten im Internet trainieren und verwenden, darunter Bücher und mehr. Wenn die Arbeit des gemeinnützigen Internetarchivs kein faires Nutzungsrecht darstellt, wie verwenden dann die kostenpflichtigen KI-Tools diese Daten?
Trotz zahlreicher Urheberrechtsklagen wegen KItextbasierte Daten aus Nachrichtenagenturen führt normalerweise nicht zu harten Urteilen gegen KI-Tools, sondern endet oft in Partnerschaften mit Hauptakteure.
Sie denken vielleicht, dass es anders ist und argumentieren, dass das Internetarchiv Bücher direkt verwendet, aber obwohl KI-Tools auf alle ihnen zur Verfügung stehenden Daten angewiesen sind, um Ihren Aufsatz zu erstellen, können Sie dennoch bestimmte Auszüge oder detailliertere Antworten von ihnen erhalten, wenn Sie eine gut formulierte Eingabeaufforderung verwenden.
Der Fall Hachette gegen Internet Archive wirft erhebliche Fragen darüber auf, wie KI-Modelle Trainingsdaten erwerben, insbesondere wenn es sich um urheberrechtlich geschützte Materialien wie Bücher handelt. KI-Systeme basieren häufig auf großen Datensätzen, darunter urheberrechtlich geschützte Texte, was ähnliche rechtliche Herausforderungen hinsichtlich der unlizenzierten Nutzung aufwirft. Wenn Gerichte die Digitalisierung und Nutzung urheberrechtlich geschützter Werke ohne Genehmigung einschränken, müssen KI-Unternehmen möglicherweise Lizenzen für die im Training verwendeten Texte erwerben, was die Komplexität erhöht und potenzielle Kosten mit sich bringt. Dies könnte den Zugriff auf vielfältige, qualitativ hochwertige Datensätze einschränken und sich letztlich auf die Entwicklung und Innovation von KI auswirken.
Darüber hinaus unterstreicht der Fall die Grenzen der Faire Nutzung Verteidigung im Kontext transformativer Nutzung, die oft zentral für die Rechtfertigung der KI für die Verwendung umfangreicher Textdaten ist. Wenn Gerichte eng auslegen, was faire Nutzung ausmacht, könnten KI-Entwickler mit mehr Einschränkungen beim Zugriff auf und der Verwendung urheberrechtlich geschützter Bücher konfrontiert werden. Diese Spannung zwischen dem Schutz der Autorenrechte und der Aufrechterhaltung des offenen Zugangs zu Wissen könnte weitreichende Folgen für die Zukunft der KI-Trainingspraktiken und die ethische Nutzung von Daten haben.
Möchten Sie tiefer in den Fall eintauchen? Hier finden Sie alles, was Sie darüber wissen müssen.
Hachette gegen Internet Archive
Hachette vs. Internet Archive ist ein bedeutender Rechtsstreit, in dem es um das Urheberrecht und die Grenzen der „Fair Use“-Doktrin im Zusammenhang mit digitalen Bibliotheken geht. Der Fall begann im Jahr 2020, als mehrere große Verlage – Hachette, HarperCollins, Penguin Random House und Wiley – das Internet Archive verklagten, eine gemeinnützige Organisation, die sich der Bewahrung digitaler Kopien von Websites, Büchern und anderen Medien widmet.
Der Fall konzentrierte sich auf die Praxis des Archivs, Bücher zu scannen und online auszuleihen.
Die Geschichte hinter der Klage gegen das Internetarchiv
Der Offene Bibliothek Das vom Internetarchiv betriebene Projekt wurde eingerichtet, um es Menschen zu ermöglichen, Bücher digital auszuleihen. Und so funktionierte es:
- Das Internetarchiv hat physische Kopien von Büchern gekauft.
- Sie haben diese Bücher gescannt und in digitale Form gebracht.
- Man konnte eine digitale Version ausleihen, aber es konnte immer nur eine Person gleichzeitig ein Buch ausleihen, genau wie beim Ausleihen eines gedruckten Buches aus einer normalen Bibliothek.
Das Internetarchiv hielt dies für legal, da es nur einer Person gleichzeitig erlaubte, ein Buch auszuleihen. Dieses System wurde als Kontrolliertes digitales Kreditgeschäft (CDL)Die Idee war, die digitale Ausleihe genauso funktionieren zu lassen wie die Ausleihe in einer physischen Bibliothek.
Als die COVID-19-Pandemie Anfang 2020 ausbrach, mussten viele Bibliotheken schließen, was den Menschen den Zugang zu Büchern erschwerte. Um zu helfen, startete das Internet Archive das Nationale Notfallbibliothek (NEL) im März 2020. Dieses Programm hat die Dinge verändert:
- Das NEL ermöglichte es mehreren Personen, gleichzeitig dieselbe digitale Kopie eines Buches auszuleihen. Damit wurde die Regel aufgehoben, dass immer nur eine Person gleichzeitig ein Exemplar ausleihen durfte.
- Ziel war es, während der Pandemie mehr Menschen Zugang zu Büchern zu verschaffen, insbesondere Studierenden und Forschenden, die zu Hause festsaßen.
Obwohl die NEL nur vorübergehend sein sollte, verärgerte sie Autoren und Verleger. Sie argumentierten, dass es einem Diebstahl ihrer Arbeit gleichkäme, wenn man vielen Leuten ohne Erlaubnis dieselbe digitale Kopie ausleihen ließe.
Aufruhr der Verleger
Im Juni 2020 verklagten die großen Verlage das Internetarchiv. Sie behaupteten:
- Das Internetarchiv hatte keine Erlaubnis, ihre Bücher zu scannen oder digital auszuleihen.
- Damit verletzte das Internetarchiv das Urheberrecht der Archive, das ihnen das alleinige Recht gibt, zu kontrollieren, wie ihre Bücher kopiert und weitergegeben werden.
- Der Ansatz der NEL, vielen Leuten gleichzeitig digitale Kopien auszuleihen, war für ihr Geschäft besonders schädlich und kam im Grunde genommen einer Piraterie gleich.
Die Verleger argumentierten, dass die Maßnahmen des Internetarchivs dem Markt für ihre Bücher schadeten. Sie sagten, die Leute würden kostenlose digitale Versionen erhalten, anstatt E-Books zu kaufen oder aus lizenzierten Bibliotheken auszuleihen.
Verteidigung des Internetarchivs
Das Internetarchiv verteidigte sich mit der Behauptung, sein Werk sei geschützt durch Faire Nutzung. Fair Use erlaubt die eingeschränkte Nutzung von urheberrechtlich geschütztem Material ohne Genehmigung für Zwecke wie Bildung, Forschung und Kommentierung. Das Archiv führte folgende Punkte an:
- Sie boten eine transformierend Service, indem er Lesern Zugriff auf physische Bücher in einer neuen, digitalen Form bietet.
- Sie erzielten damit keinen Gewinn, da es sich um eine gemeinnützige Organisation handelt, deren Aufgabe es ist, Wissen zu bewahren und zugänglich zu machen.
- Das NEL war eine vorübergehende Reaktion auf die Pandemie und versuchte, Menschen zu helfen, die während der Krise keinen Zugang zu Büchern hatten.
Sie verwiesen auch auf ihre Kontrollierte digitale Kreditvergabe System, um Urheberrechte zu respektieren. Unter CDL konnte nur eine Person gleichzeitig ein Buch ausleihen, genau wie in einer physischen Bibliothek.
Die Entscheidungen des Gerichts
Urteil des Bezirksgerichts (März 2023)
Im März 2023 gab ein Bundesgericht den Verlegern Recht. Richter John G. Koeltl entschied, dass die Handlungen des Internetarchivs nicht durch Fair Use geschützt seien. Er sagte:
- Die digitale Ausleihe des Internetarchivs war nicht transformierend weil sie den Büchern nichts Neues hinzufügten. Sie kopierten sie lediglich in digitaler Form, was für eine faire Verwendung nicht ausreichte.
- Das Gericht stellte außerdem fest, dass das Ausleihen des Archivs dem Markt für gedruckte und digitale Versionen der Bücher schadete. Durch das Angebot kostenloser digitaler Kopien wurde das Internetarchiv als Konkurrenz zu den E-Book-Verkäufen der Verlage angesehen.
- Das Gericht abgeschlossen die das Archiv erstellt hatte abgeleitete Werkewas bedeutet, dass sie ohne Erlaubnis neue Versionen der Bücher (digitale Kopien) erstellt haben.
Urteil des Berufungsgerichts (August 2023)
Das Internetarchiv legte gegen die Entscheidung Berufung bei einem höheren Gericht ein, dem US-Berufungsgericht für den zweiten Gerichtsbezirk, in der Hoffnung, das Urteil aufheben zu lassen. Das Berufungsgericht entschied jedoch ebenfalls zugunsten der Verleger, machte jedoch eine wichtige Klarstellung:
- Das Gericht erkannte an, dass das Internetarchiv ein gemeinnützig Organisation und nicht kommerziell. Diese Unterscheidung war wichtig, weil kommerzielle Nutzung oft eine Fair-Use-Verteidigung schwächen kann, aber in diesem Fall erkannte das Gericht an, dass das Archiv nicht gewinnorientiert war.
- Trotzdem schloss das Gericht, dass die Handlungen des Archivs nicht durch das Fair-Use-Gesetz geschützt seien, auch wenn es sich um eine gemeinnützige Organisation handele.
Fazit
Der Fall Hachette gegen Internet Archive hat gezeigt, dass selbst gemeinnützige Organisationen wie das Internet Archive Bücher nicht frei digitalisieren und verleihen können, ohne gegen Urheberrechte zu verstoßen. Dieses Urteil könnte auch Auswirkungen darauf haben, wie KI-Unternehmen urheberrechtlich geschützte Materialien verwenden, um ihre Systeme zu trainieren. Wenn gemeinnützige Organisationen mit solchen Einschränkungen konfrontiert sind, müssen KI-Tools möglicherweise Lizenzen für die von ihnen verwendeten Daten erwerben. Selbst wenn sie bereits begann, einige Geschäfte zu machenfrage ich mich, was ist mit dem erste Einträge?
Bildnachweis: Eray Eliacık/Bing