Fair Use urheberrechtlich geschützter Werke: US-Gericht entscheidet über geschützte Bücher, die zur Ausbildung von Claude verwendet wurden

Eine kürzlich ergangene Entscheidung eines US-Bundesgerichts hat wichtige Einblicke in die komplexen urheberrechtlichen Fragen geliefert, die entstehen, wenn KI-Unternehmen riesige Buchsammlungen nutzen, um große Sprachmodelle (LLMs) zu trainieren. Im wegweisenden Fall Bartz et al. v. Anthropic PBC erließ Richter William Alsup vom Northern District of California ein teilweises summarisches Urteil darüber, ob das unerlaubte Kopieren von Büchern durch das KI-Unternehmen Anthropic unter die Schrankenregelung des „Fair Use“ gemäß § 107 des US-amerikanischen Urheberrechtsgesetzes fällt.

Die Entscheidung verdeutlicht einen zentralen Spannungsbereich zwischen Innovation und geistigen Eigentumsrechten und lädt zu einem Vergleich mit dem EU-Urheberrecht ein, insbesondere mit Artikel 4 der Richtlinie über das Urheberrecht im digitalen Binnenmarkt (CDSM-Richtlinie).

Was geschah vor der Klage?

Anthropic, der Entwickler des Claude-KI-Systems, hatte über sieben Millionen Bücher aus illegalen und gekauften Quellen kopiert und auf zwei Hauptarten genutzt:

  1. Zum Aufbau einer dauerhaften internen Forschungsbibliothek.
  2. Zum Training seiner LLMs, einschließlich Claude, durch Auswahl von Teilmengen dieser Bücher.

Das Gericht prüfte, ob diese Nutzungen unter die Schranke des „Fair Use“ nach § 107 des US Copyright Act fallen. Es wurden vier Verwendungen analysiert:

  • Training von LLMs mit Büchern (einschließlich „transformierender Nutzung“).
  • Digitalisierung rechtmäßig erworbener Printbücher.
  • Aufbau einer zentralisierten digitalen Bibliothek aus Raubkopien.
  • Aufbewahrung nicht genutzter Raubkopien für potenzielle künftige Nutzung.

Was entschied das Gericht?

  1. Das Training von LLMs mit Büchern ist „transformierend“ und fällt unter „Fair Use“
    Das Gericht stellte fest, dass das Training von Claude mit urheberrechtlich geschützten Büchern keine vervielfältigende oder verbreitende Nutzung darstellt. Stattdessen werden die Inhalte in neue statistische Relationen und generative Fähigkeiten überführt – eine neuartige Nutzung, die das Original nicht ersetzt. Daher wurde dies als rechtmäßiger „Fair Use“ anerkannt.
  2. Auch die Digitalisierung rechtmäßig erworbener Druckwerke ist „Fair Use“
    Anthropic vernichtete die physischen Kopien nach dem Einscannen und nutzte die digitalen Versionen ausschließlich intern. Das Gericht verglich dies mit früheren Entscheidungen, bei denen sogenanntes „Format-Shifting“ (z. B. analog zu digital) erlaubt war, solange keine Weiterverbreitung stattfand. Es wurden keine zusätzlichen Kopien erzeugt und kein Markt geschädigt.
  3. Die Aufbewahrung piratischer Bücher für Bibliothekszwecke ist kein „Fair Use“
    Das Gericht wies die Argumentation zurück, dass der bloße Aufbau einer umfassenden Forschungsbibliothek mit Raubkopien rechtlich geschützt sei. Der Richter betonte, dass der Aufbau einer „Bibliothek aller Bücher der Welt“ durch Piraterie grundsätzlich eine Urheberrechtsverletzung darstellt – selbst wenn einzelne Werke später in rechtlich zulässigen Kontexten wie dem Training verwendet werden.

Wie würde das EU-Recht dies bewerten? Vergleich mit Artikel 4 der CDSM-Richtlinie

Aspekt USA („Fair Use“) EU (Art. 4 CDSM-Richtlinie)
Zweck Offen („transformative Nutzung“) Zweckoffen, aber Rechteinhaber können Nutzung ausschließen
Opt-out-Möglichkeit Nicht vorgesehen – Fair Use gilt ex post Expliziter Opt-out durch Rechteinhaber möglich
Piratische Quellen Niemals erlaubt Niemals erlaubt
Aufbewahrung für spätere Nutzung Möglicherweise rechtswidrig ohne Rechtfertigung Nur „solange wie für Text- und Data-Mining notwendig“ und nur bei rechtmäßigem Zugang
Lizenzierungspflicht Keine bei „Fair Use“ Nur zulässig, wenn kein Opt-out erfolgt ist

Nach EU-Recht hätte die Nutzung piratischer Quellen durch Anthropic ebenfalls klar außerhalb des Anwendungsbereichs von Artikel 4 der CDSM-Richtlinie gelegen. Die Ausnahme für Text- und Data-Mining setzt einen rechtmäßigen Zugang voraus – Inhalte aus Raubbibliotheken wie Books3 oder LibGen wären also ausgeschlossen. Zudem können europäische Verlage ihre Inhalte maschinenlesbar vom Mining ausschließen, was KI-Unternehmen verpflichtet, vorab Lizenzen einzuholen.

  • Fazit

    In den USA bleibt der „Fair Use“-Grundsatz flexibel, wird aber zunehmend kontextabhängig interpretiert. „Transformative Nutzung“ – insbesondere im Bereich KI-Training – ist eine starke Verteidigung, rechtfertigt aber nicht die illegale Beschaffung der Inhalte.
  • In der EU setzen der erforderliche rechtmäßige Zugang und die Opt-out-Möglichkeit der Rechteinhaber deutlich engere Grenzen für KI-Trainingsdaten, auch wenn die Nutzung selbst innovativ ist.
  • KI-Entwicklungsunternehmen sollten:
    • Ihre Datensätze auf Herkunft und Lizenzierung prüfen.
    • Mechanismen zur Einhaltung von Opt-out-Signalen nach der CDSM-Richtlinie einführen.
    • Auf Raubkopien verzichten – auch für interne oder nicht-öffentliche Zwecke.

Die Entscheidung in Bartz v. Anthropic zeigt ein wachsendes gerichtliches Bewusstsein für die komplexen Schnittstellen zwischen KI und Urheberrecht. Während das Gericht Innovation durch „Fair Use“ stützt, zieht es eine klare Grenze bei Piraterie – eine Position, die mit den formalisierten Schutzmechanismen des EU-Rechts in Einklang steht.

Haftungsausschluss:
Die Inhalte dieses Blogs dienen ausschließlich allgemeinen Informationszwecken und stellen keine Rechtsberatung dar. Obwohl wir uns bemühen, die Informationen aktuell und korrekt zu halten, können sie nicht die neuesten rechtlichen Entwicklungen oder die spezifische Situation Ihres Unternehmens berücksichtigen. Leser sollten auf Grundlage der hier bereitgestellten Informationen nicht handeln, ohne vorher professionelle Rechtsberatung einzuholen. Durch die Nutzung oder das Vertrauen auf die Inhalte dieses Blogs entsteht kein Mandatsverhältnis