Uso justo de obras protegidas por derechos de autor: Tribunal de EE. UU. dictamina sobre libros protegidos utilizados para entrenar a Claude

Una reciente decisión de un tribunal federal de Estados Unidos ha arrojado luz sobre las complejas cuestiones de derechos de autor que surgen cuando las empresas de inteligencia artificial utilizan vastas bibliotecas de libros para entrenar modelos de lenguaje de gran escala (LLM). En el caso emblemático Bartz et al. v. Anthropic PBC, el juez William Alsup, del Distrito Norte de California, emitió un fallo sumario parcial sobre si la copia no autorizada de libros por parte de la empresa de IA Anthropic constituía un “uso legítimo” (fair use) conforme al artículo 107 de la Ley de Derechos de Autor de EE.UU.

La decisión pone de relieve una tensión clave entre la innovación y los derechos de propiedad intelectual, e invita a una comparación con el derecho de autor de la UE, en particular con el artículo 4 de la Directiva sobre los derechos de autor en el mercado único digital (Directiva CDSM).

¿Qué sucedió antes de la demanda?

Anthropic, creadora del sistema Claude AI, copió más de siete millones de libros de fuentes pirateadas y compradas, utilizándolos de dos maneras principales:

  • Para construir una biblioteca de investigación interna permanente.
  • Para entrenar sus LLMs, incluido Claude, seleccionando subconjuntos de estos libros.

El tribunal evaluó si estos usos calificaban como “uso legítimo” según el artículo 107 de la Ley de Derechos de Autor de EE.UU., analizando cuatro usos distintos:

  1. Entrenamiento de LLMs con libros (incluido el uso “transformador” del contenido).
  2. Digitalización de libros impresos legalmente adquiridos.
  3. Creación de una biblioteca digital centralizada a partir de copias pirateadas.
  4. Conservación de libros pirateados no utilizados para posibles usos futuros.

¿Qué concluyó el tribunal?

  1. El entrenamiento de LLMs con libros es “uso legítimo” y transformador
    El tribunal determinó que entrenar a Claude con libros protegidos por derechos de autor no reproducía ni distribuía salidas infractoras, sino que transformaba los libros en relaciones estadísticas nuevas y capacidades generativas, un uso que no sustituye al original. Por tanto, se consideró un uso legítimo conforme al derecho estadounidense.
  2. Digitalizar copias físicas legalmente adquiridas también es “uso legítimo”
    Anthropic destruyó las copias físicas tras escanearlas, utilizando las versiones digitales únicamente de forma interna. El tribunal comparó esto con casos anteriores donde el cambio de formato (por ejemplo, de analógico a digital) fue aceptado, siempre que no condujera a la redistribución. No se crearon copias adicionales, ni se perjudicó un nuevo mercado.
  3. Almacenar libros pirateados para propósitos de biblioteca no es “uso legítimo”
    El tribunal rechazó la idea de que mantener una biblioteca de investigación con copias pirateadas esté protegido. El juez subrayó que construir una “biblioteca de todos los libros del mundo” mediante piratería es intrínsecamente infractor, incluso si algunos libros luego se usan en contextos legítimos como el entrenamiento de IA.

¿Cómo evaluaría esto el derecho de la UE? Comparación con el artículo 4 de la Directiva CDSM

Aspecto EE.UU. (“Fair Use”) UE (Art. 4 Directiva CDSM)
Finalidad Abierta (“uso transformador”) Abierto a cualquier finalidad, pero los titulares pueden reservar sus derechos
Mecanismo de exclusión (opt-out) No existe—se aplica ex post Mecanismo de exclusión explícito para los titulares
Copias pirateadas Nunca permitidas Nunca permitidas
Conservación para uso futuro Posiblemente infractora si no está justificada Permitida solo “mientras sea necesario” y con acceso legal
Licenciamiento obligatorio No es obligatorio si el uso es legítimo Solo permitido si no se ha ejercido el opt-out

En la UE, el uso por parte de Anthropic de copias pirateadas también habría quedado claramente fuera del ámbito del artículo 4 de la Directiva CDSM. La excepción de text and data mining requiere acceso legal, lo que significa que el contenido obtenido de bibliotecas pirata como Books3 o LibGen no calificaría. Además, los editores de la UE pueden excluir sus contenidos mediante marcas legibles por máquina, lo que impide a las empresas de IA usarlos sin obtener previamente una licencia.

Conclusión

  • En EE.UU., el “uso legítimo” sigue siendo flexible, pero cada vez más dependiente del contexto. El “uso transformador”, especialmente en el entrenamiento de IA, es una defensa sólida, pero no justifica la adquisición ilegal inicial.
  • En la UE, el requisito de acceso legal y el mecanismo de exclusión de los autores imponen límites más estrictos a los conjuntos de datos de entrenamiento de IA, incluso cuando el uso final sea innovador.
  • Las empresas que desarrollan sistemas de IA deberían:
    • Auditar los conjuntos de datos en cuanto a su origen y licenciamiento.
    • Implementar mecanismos para cumplir con las señales de exclusión del CDSM.
    • Evitar el uso de contenido pirateado, incluso para fines internos o no públicos.

La sentencia en Bartz v. Anthropic refleja una creciente conciencia judicial sobre las formas matizadas en que la IA interactúa con las leyes de derechos de autor. Aunque el tribunal respaldó la innovación a través del “uso legítimo”, trazó una línea firme contra la piratería, alineándose con las salvaguardas más formales del derecho de la UE.

¿Necesitas ayuda con tu IA?

¡Contáctanos hoy!

Aviso Legal:
El contenido de este blog se proporciona únicamente con fines informativos generales y no constituye asesoramiento jurídico. Si bien nos esforzamos por asegurar que la información sea precisa y esté actualizada, puede que no refleje los desarrollos legales más recientes ni las circunstancias específicas de tu organización. Los lectores no deben actuar basándose en la información contenida en este blog sin antes buscar asesoramiento legal profesional. El uso de esta información no crea una relación abogado-cliente