Da Open-Source-Software und künstliche Intelligenz die Technologielandschaft weiterhin verändern, ist es wichtiger denn je zu verstehen, wie Lizenzen und Urheberrechte deine Arbeit beeinflussen. Ob du nun eigenen Code entwickelst, Open-Source-Bibliotheken wiederverwendest, KI-Modelle trainierst oder Datensätze teilst, die rechtlichen Entscheidungen, die du triffst, wirken sich auf Zusammenarbeit, Verbreitung und kommerzielle Nutzung aus.
Besonders hervorzuheben ist der im Juli 2025 veröffentlichte US-Aktionsplan für Künstliche Intelligenz, der die strategische Bedeutung von KI-Innovationen, Open-Source- und Open-Weight-KI-Modellen sowie hochwertigen Daten als nationale Ressourcen unterstreicht. Dies verdeutlicht, wie wichtig es für Entwickler ist, sich mit Lizenzpraktiken vertraut zu machen, die eine verantwortungsvolle, sichere und wettbewerbsfähige KI-Entwicklung ermöglichen. (Für eine kurze Übersicht über den US-Aktionsplan für KI, lies unseren Blogartikel hier)
Dieser Artikel beleuchtet die komplexen Themen rund um Open-Source-Lizenzen und Urheberrecht für Software- und KI-Entwickler.
Open-Source-Software und KI-Artefakte unterliegen Lizenzen, die festlegen, wie Code, Daten und Modelle verwendet, verändert und weitergegeben werden dürfen. Diese Lizenzen lassen sich grob in zwei Kategorien einteilen:
-
Permissive Lizenzen – erlauben nahezu jede Nutzung mit minimalen Anforderungen
-
Copyleft-Lizenzen – verlangen, dass abgeleitete Werke unter denselben Bedingungen offen bleiben
Beliebte permissive Lizenzen sind unter anderem MIT, Apache 2.0, BSD und beliebte Copyleft-Lizenzen GNU GPL v2/v3, Mozilla Public License (MPL).
Für nicht-codebasierte Assets wie Datensätze oder Modelle werden häufig Creative-Commons-Lizenzen (z. B. CC BY, CC BY-SA, CC0) verwendet, sowie datenspezifische Lizenzen wie CDLA-Permissive-2.0 und ODC-By. Jede Lizenzart stellt unterschiedliche Anforderungen an Namensnennung, Weiterverbreitung und kommerzielle Nutzung, besonders wichtig bei der Integration in proprietäre Produkte oder beim Training von KI-Modellen.
Permissive Lizenzen
-
MIT-Lizenz: Sehr frei – erlaubt die Wiederverwendung in proprietärer Software mit minimalen Bedingungen (hauptsächlich Namensnennung).
-
Apache-Lizenz 2.0: Ebenfalls permissiv, enthält zusätzlich eine ausdrückliche Patentfreigabe zum Schutz vor Patentstreitigkeiten, ein wesentlicher Unterschied zu MIT/BSD.
Hinweis: Sowohl gpt-oss-20b als auch gpt-oss-120b wurden unter dieser Lizenz veröffentlicht. -
BSD-Lizenz: Ähnlich wie MIT, sehr permissiv, häufig in Forschung und Industrie genutzt – maximale Flexibilität und klare Haftungsausschlüsse.
Copyleft- und Schwaches-Copyleft-Lizenzen
-
GNU GPL: Starker Copyleft, verlangt, dass alle abgeleiteten Werke ebenfalls unter der GPL veröffentlicht werden.
-
Mozilla Public License 2.0 (MPL): Schwaches Copyleft, betrifft nur geänderte Dateien, wodurch sich der Code mit proprietären Komponenten kombinieren lässt.
Modellspezifische und Daten-/Modell-Lizenzen für KI
Traditionelle Open-Source-Lizenzen wurden für Code entworfen und sind oft nicht ideal für Modellgewichte oder Trainingsdaten. Neue modellspezifische Lizenzen entstehen:
-
OpenRAIL (Responsible AI License): Verwendet u. a. von Stable Diffusion und BLOOM; ergänzt ethische Einschränkungen (z. B. Verbot schädlicher Nutzung).
Hinweis: Nicht OSI-konform, rechtlich unterschiedlich durchsetzbar.
-
OpenMDW (Model, Data & Weights License): 2025 eingeführt – eine umfassende, permissive Lizenz für Modellcode, -gewichte, Datensätze, Dokumentation und Software („Model Materials“). Ziel ist Klarheit und Einheitlichkeit durch eine einzelne Lizenz für alle Modellbestandteile – inklusive ausdrücklicher Rechteübertragungen (Urheberrecht, Patent, Datenbank, Geschäftsgeheimnisse) und ohne Kombinieren mehrerer Lizenzen.
Datenspezifische Lizenzen
-
CDLA-Permissive-2.0: Für Datensätze
-
ODC-By: Für Datenbanken
Creative Commons (für Daten und Modelle)
-
CC0: Gemeinfreiheit – keine Einschränkungen
-
CC BY: Namensnennung erforderlich
-
CC BY-SA: Abgeleitete Werke müssen unter gleichen Bedingungen veröffentlicht werden
-
CC BY-NC: Keine kommerzielle Nutzung erlaubt
-
CC BY-ND: Keine Bearbeitung oder abgeleitete Werke erlaubt
Hinweis: Creative-Commons-Lizenzen sind nicht geeignet für Software-Code, da sie wichtige Bestandteile wie Patentklauseln oder Anforderungen an Quellcodeoffenlegung und Weiterverteilung nicht abdecken. Sie eignen sich stattdessen für Datensätze, Dokumentation und andere nicht-codebasierte Inhalte.
Vergleich von Lizenzmerkmalen
-
Permissive Lizenzen (MIT, BSD, Apache) ermöglichen proprietäre Nutzung mit geringen Auflagen. Apache 2.0 bietet zudem Patentschutz.
-
Copyleft-Lizenzen (GPL, MPL) garantieren Offenheit bei Weiterentwicklungen. Die GPL stellt sicher, dass alle Ableitungen frei bleiben.
-
Modellspezifische Lizenzen (OpenMDW, OpenRAIL) bieten maßgeschneiderte Regelungen für KI-Modelle, verantwortungsvollen Umgang, und bei OpenMDW eine einheitliche Lizenzierung für Code und Nicht-Code-Komponenten.
Namensnennung und Einbindung von Lizenzhinweisen sind bei allen anerkannten FOSS-Lizenzen obligatorisch, insbesondere bei Weiterverwendung.
Wahl der Lizenz: Vor- und Nachteile je nach Projekttyp
-
Kommerzielle Software: Bevorzuge permissive Lizenzen – größtmögliche Kompatibilität mit proprietären/kommerziellen Anwendungen.
-
Interne Tools: Lizenzwahl weniger kritisch – es sei denn, eine externe Verteilung ist geplant.
-
KI-Entwicklung: Permissive Lizenzen weiterhin dominant, aber modellspezifische Lizenzen wie OpenMDW und OpenRAIL gewinnen an Bedeutung – insbesondere wegen umfassender Rechte und verantwortungsvoller Nutzung. Striktes Copyleft kann in der Industrie abschreckend wirken.
-
Community-Projekte: Copyleft fördert Rückflüsse an die Community; permissive Lizenzen ziehen breitere Mitwirkung an (auch von Unternehmen).
Urheberrecht in der EU vs. USA
-
Urheberschaft & Originalität: EU verlangt eine „eigene geistige Schöpfung“; USA haben geringere Anforderungen („kreative Leistung“).
-
Eigentum an Werken: In der EU halten Arbeitgeber in der Regel die wirtschaftlichen Rechte; in den USA greift die „work for hire“-Regel – mit vertraglichen und nationalen Ausnahmen.
-
KI-generierte Werke: Beide Regionen fordern menschliche Urheberschaft. Die EU erlaubt Ausnahmen für Text-/Daten-Mining – Rechteinhaber können widersprechen. In den USA greift die Fair-Use-Doktrin – offener, aber rechtlich unsicherer.
-
Schutzdauer: Üblicherweise Lebenszeit des Autors plus 70 Jahre (mit Ausnahmen für Firmenwerke in den USA).
-
Urheberpersönlichkeitsrechte: In der EU stärker ausgeprägt (z. B. Recht auf Namensnennung und Werkintegrität); in den USA eingeschränkt und oft verzichtbar.
KI-Training und Daten: Jurisdiktionsübergreifende Fragestellungen
-
EU: Klare Urheberrechtsausnahmen für KI-Training/Datenanalyse – Rechteinhaber können aktiv widersprechen.
-
USA: Weit gefasste, aber weniger klar definierte Fair Use-Regeln gelten für Modell-/Datentraining.
-
Patentrechte: Besonders relevant in den USA. Apache 2.0 und OpenMDW enthalten ausdrückliche Patentfreigaben – reduzieren das Risiko von Rechtsstreitigkeiten.
Fazit
Bei der Wahl einer Open-Source-Lizenz für Software oder KI-Modelle solltest du den Typ des Assets (Code, Daten, Modell, Dokumentation), rechtliche Risiken (z. B. Patente), Projektziele und länderspezifische Besonderheiten beim Daten-/Modelltraining berücksichtigen.
Für moderne KI-Projekte bieten modellspezifische Lizenzen wie OpenMDW zunehmend die besten Vorteile: breite Nutzungsrechte, klare rechtliche Absicherung und Einfachheit durch eine einheitliche Lizenz für alle Komponenten – ohne Lizenz-Wirrwarr.