Licencias de Código Abierto y Derechos de Autor: Consideraciones Clave para el Desarrollo de Software e Inteligencia Artificial

Open Source Copyright for AI & software

A medida que el software de código abierto y la inteligencia artificial continúan transformando el panorama tecnológico, comprender cómo las licencias y los derechos de autor afectan tu trabajo nunca ha sido más importante. Ya sea que estés creando código original, reutilizando bibliotecas de código abierto, entrenando modelos de IA o compartiendo conjuntos de datos, las decisiones legales que tomes influirán en la colaboración, distribución y potencial comercial.

De forma destacada, el reciente Plan de Acción sobre IA de EE. UU., presentado en julio de 2025, subraya la importancia estratégica de la innovación en IA, los modelos de código abierto y con pesos abiertos (open-weight), y los datos de alta calidad como activos nacionales, reforzando la necesidad de que los desarrolladores se mantengan informados sobre prácticas de licenciamiento que permitan un desarrollo de IA responsable, seguro y competitivo en todo el país. (Para una visión general rápida del Plan de Acción sobre IA de EE. UU., lee nuestro artículo en el blog aquí.)

Este artículo explica las complejidades del licenciamiento de código abierto y los derechos de autor tanto para desarrolladores de software como de IA.

El software y los artefactos de IA de código abierto están regulados por licencias que especifican cómo se puede usar, modificar y compartir el código, los datos y los modelos. Estas licencias se agrupan en dos grandes categorías:

  • Licencias permisivas, que permiten casi cualquier uso con mínimas obligaciones, y

  • Licencias copyleft, que exigen que las obras derivadas se mantengan abiertas bajo los mismos términos.

Licencias permisivas populares incluyen MIT, Apache 2.0 y BSD; licencias copyleft comunes incluyen GNU GPL v2/v3 y la Licencia Pública de Mozilla (MPL).

Para activos no relacionados con código, como conjuntos de datos o modelos, se utilizan frecuentemente licencias Creative Commons (por ejemplo, CC BY, CC BY-SA, CC0), junto con licencias específicas para datos como CDLA-Permissive-2.0 y ODC-By. Cada tipo de licencia impone requisitos diferentes en cuanto a atribución, redistribución y uso comercial, lo cual es especialmente importante al integrar contenido en productos propietarios o al usarlo para entrenar modelos de IA.

Licencias Permisivas

  • Licencia MIT: Extremadamente permisiva; permite su uso en productos propietarios con requisitos mínimos (principalmente atribución).

  • Licencia Apache 2.0: También permisiva, pero agrega una concesión explícita de patentes para proteger contra disputas, lo que la distingue de las licencias MIT/BSD.
    Nota: Tanto gpt-oss-20b como gpt-oss-120b han sido publicados bajo esta licencia.

  • Licencia BSD: Similar a MIT, muy permisiva y comúnmente usada en el ámbito académico/industrial por su flexibilidad y claridad sobre avales.

Licencias Copyleft y Copyleft Débil

  • GNU GPL: Copyleft fuerte, exige que todas las obras derivadas se mantengan como código abierto bajo GPL.

  • Licencia Pública de Mozilla 2.0 (MPL): Copyleft débil, aplica requisitos de copyleft solo a los archivos modificados, permitiendo combinar código con elementos propietarios.

Licencias Específicas para Modelos y Datos en IA

Las licencias tradicionales de código abierto fueron diseñadas para software y no siempre se adaptan bien a los pesos de modelos de IA o conjuntos de datos. Para modelos contemporáneos, están surgiendo licencias específicas:

  • OpenRAIL (Licencia de IA Responsable): Utilizada por modelos como Stable Diffusion y BLOOM, las licencias RAIL añaden restricciones éticas (por ejemplo, prohibición de usos maliciosos o perjudiciales).

    Nota: Estas no son compatibles con OSI y su aplicabilidad legal varía.

  • Licencia OpenMDW (Model, Data & Weights): Introducida en 2025 como una licencia permisiva integral que cubre código de modelos, pesos, conjuntos de datos, documentación y software relacionado («Materiales del Modelo»). OpenMDW busca ofrecer claridad y consistencia en todos los elementos de un modelo, proporcionando una única licencia diseñada para IA, con concesiones explícitas sobre derechos de autor, patentes, bases de datos y secretos comerciales, facilitando un uso amplio sin restricciones y eliminando la necesidad de múltiples licencias combinadas.

Licencias Específicas para Datos

  • CDLA-Permissive-2.0: Para conjuntos de datos.

  • ODC-By: Para bases de datos.

Creative Commons (para Datos y Modelos)

  • CC0: Dedicación al dominio público, sin restricciones.

  • CC BY: Requiere atribución.

  • CC BY-SA: Requiere que las obras derivadas se licencien bajo los mismos términos.

  • CC BY-NC: Restringe el uso comercial.

  • CC BY-ND: No permite obras derivadas.

Nota: Las licencias Creative Commons no se recomiendan para distribuir código fuente, ya que carecen de cláusulas esenciales relacionadas con derechos de patente, disponibilidad del código fuente y modificación/distribución. En cambio, se recomienda su uso para conjuntos de datos, documentación u otros materiales no relacionados con código.

Comparación de Características de Licencias

  • Las licencias permisivas (MIT, BSD, Apache) permiten el uso propietario con obligaciones mínimas. Apache 2.0 destaca por su protección explícita de patentes.

  • Las licencias copyleft (GPL, MPL) garantizan la apertura continua de las obras derivadas. GPL asegura que todas las obras derivadas permanezcan libres.

  • Las licencias específicas para modelos (OpenMDW, OpenRAIL) ofrecen una cobertura adaptada para modelos y artefactos de IA, añadiendo claridad, cláusulas de uso responsable y, en el caso de OpenMDW, un enfoque integral y alineado con OSI para componentes de código y no código.

La atribución y la inclusión de avisos de licencia son universales para todas las licencias FOSS (software libre y de código abierto) reconocidas y generalmente obligatorias para los usos derivados.

Elección de Licencia: Ventajas y Desventajas según el Tipo de Proyecto

  • Software Comercial: Se prefieren licencias permisivas por su máxima compatibilidad con despliegues propietarios/comerciales.

  • Herramientas Internas: La elección de licencia es menos crítica, salvo que se planee distribución externa.

  • Desarrollo de IA: Las licencias permisivas siguen siendo dominantes, pero las licencias emergentes específicas de modelos (OpenMDW, OpenRAIL) están ganando tracción por su cobertura integral y condiciones de uso responsable. El copyleft puro puede disuadir su adopción, especialmente en el sector industrial.

  • Proyectos Comunitarios: El copyleft garantiza reciprocidad comunitaria; las licencias permisivas atraen una participación más amplia (incluidas empresas).

Derechos de Autor en la UE vs EE. UU.

  • Autoría y Originalidad: La UE exige una “creación intelectual propia”; EE. UU. requiere un umbral más bajo de “creatividad”.

  • Propiedad por Defecto: En la UE, los empleadores suelen tener los derechos económicos sobre el software creado por empleados; en EE. UU. se aplica la doctrina del «trabajo por encargo», aunque con matices contractuales y nacionales.

  • Obras Generadas por IA: Ambas regiones exigen autoría humana para la protección por derechos de autor. La UE ha introducido excepciones para minería de textos/datos, permitiendo a los titulares optar por excluir su contenido del entrenamiento de IA; EE. UU. se basa en el principio del fair use (uso legítimo), ofreciendo un entorno más abierto pero menos predecible.

  • Duración: Generalmente, ambos otorgan derechos de autor por la vida del autor más 70 años (con algunas variaciones en EE. UU. para obras corporativas).

  • Derechos Morales: Más protegidos en la UE (por ejemplo, derecho a atribución/integridad) que en EE. UU., donde estos derechos están limitados y a menudo pueden renunciarse.

Entrenamiento de Modelos de IA y Datos: Cuestiones Transjurisdiccionales

  • UE: Excepciones explícitas de derechos de autor para minería de datos/IA, sujetas a la opción de exclusión por parte del titular de derechos.

  • EE. UU.: Se aplica la doctrina más amplia (pero menos definida) del fair use en cuanto al estado legal del entrenamiento con datos/modelos.

  • Derechos de Patente: Especialmente relevantes en EE. UU.; Apache 2.0 y OpenMDW conceden explícitamente derechos de patente, reduciendo el riesgo de litigios para los implementadores.

Conclusión

Al elegir una licencia de código abierto para software o modelos de IA, considera el tipo de activo (código, datos, modelo, documentación), los riesgos legales (incluidas patentes), los objetivos del proyecto y los problemas jurisdiccionales que afectan al entrenamiento de modelos/datos.

Para lanzamientos modernos de IA, licencias específicas como OpenMDW ofrecen cada vez más lo mejor de ambos mundos: uso permisivo amplio, cobertura clara de derechos y simplicidad al eliminar la necesidad de múltiples licencias superpuestas.

Aviso Legal:
El contenido de este blog se proporciona únicamente con fines informativos generales y no constituye asesoramiento jurídico. Si bien nos esforzamos por asegurar que la información sea precisa y esté actualizada, puede que no refleje los desarrollos legales más recientes ni las circunstancias específicas de tu organización. Los lectores no deben actuar basándose en la información contenida en este blog sin antes buscar asesoramiento legal profesional. El uso de esta información no crea una relación abogado-cliente