Open-Source-Lizenzen und Urheberrecht: Zentrale Überlegungen für Software- und KI-Entwicklung

Open Source Copyright for AI & software

Da Open-Source-Software und künstliche Intelligenz die Technologielandschaft weiterhin verändern, ist es wichtiger denn je zu verstehen, wie Lizenzen und Urheberrechte deine Arbeit beeinflussen. Ob du nun eigenen Code entwickelst, Open-Source-Bibliotheken wiederverwendest, KI-Modelle trainierst oder Datensätze teilst, die rechtlichen Entscheidungen, die du triffst, wirken sich auf Zusammenarbeit, Verbreitung und kommerzielle Nutzung aus.

Besonders hervorzuheben ist der im Juli 2025 veröffentlichte US-Aktionsplan für Künstliche Intelligenz, der die strategische Bedeutung von KI-Innovationen, Open-Source- und Open-Weight-KI-Modellen sowie hochwertigen Daten als nationale Ressourcen unterstreicht. Dies verdeutlicht, wie wichtig es für Entwickler ist, sich mit Lizenzpraktiken vertraut zu machen, die eine verantwortungsvolle, sichere und wettbewerbsfähige KI-Entwicklung ermöglichen. (Für eine kurze Übersicht über den US-Aktionsplan für KI, lies unseren Blogartikel hier)

Dieser Artikel beleuchtet die komplexen Themen rund um Open-Source-Lizenzen und Urheberrecht für Software- und KI-Entwickler.

Open-Source-Software und KI-Artefakte unterliegen Lizenzen, die festlegen, wie Code, Daten und Modelle verwendet, verändert und weitergegeben werden dürfen. Diese Lizenzen lassen sich grob in zwei Kategorien einteilen:

  • Permissive Lizenzen – erlauben nahezu jede Nutzung mit minimalen Anforderungen

  • Copyleft-Lizenzen – verlangen, dass abgeleitete Werke unter denselben Bedingungen offen bleiben

Beliebte permissive Lizenzen sind unter anderem MIT, Apache 2.0, BSD und beliebte Copyleft-Lizenzen GNU GPL v2/v3, Mozilla Public License (MPL).

Für nicht-codebasierte Assets wie Datensätze oder Modelle werden häufig Creative-Commons-Lizenzen (z. B. CC BY, CC BY-SA, CC0) verwendet, sowie datenspezifische Lizenzen wie CDLA-Permissive-2.0 und ODC-By. Jede Lizenzart stellt unterschiedliche Anforderungen an Namensnennung, Weiterverbreitung und kommerzielle Nutzung, besonders wichtig bei der Integration in proprietäre Produkte oder beim Training von KI-Modellen.

Permissive Lizenzen

  • MIT-Lizenz: Sehr frei – erlaubt die Wiederverwendung in proprietärer Software mit minimalen Bedingungen (hauptsächlich Namensnennung).

  • Apache-Lizenz 2.0: Ebenfalls permissiv, enthält zusätzlich eine ausdrückliche Patentfreigabe zum Schutz vor Patentstreitigkeiten, ein wesentlicher Unterschied zu MIT/BSD.
    Hinweis: Sowohl gpt-oss-20b als auch gpt-oss-120b wurden unter dieser Lizenz veröffentlicht.

  • BSD-Lizenz: Ähnlich wie MIT, sehr permissiv, häufig in Forschung und Industrie genutzt – maximale Flexibilität und klare Haftungsausschlüsse.

Copyleft- und Schwaches-Copyleft-Lizenzen

  • GNU GPL: Starker Copyleft, verlangt, dass alle abgeleiteten Werke ebenfalls unter der GPL veröffentlicht werden.

  • Mozilla Public License 2.0 (MPL): Schwaches Copyleft, betrifft nur geänderte Dateien, wodurch sich der Code mit proprietären Komponenten kombinieren lässt.

Modellspezifische und Daten-/Modell-Lizenzen für KI

Traditionelle Open-Source-Lizenzen wurden für Code entworfen und sind oft nicht ideal für Modellgewichte oder Trainingsdaten. Neue modellspezifische Lizenzen entstehen:

  • OpenRAIL (Responsible AI License): Verwendet u. a. von Stable Diffusion und BLOOM; ergänzt ethische Einschränkungen (z. B. Verbot schädlicher Nutzung).

    Hinweis: Nicht OSI-konform, rechtlich unterschiedlich durchsetzbar.

  • OpenMDW (Model, Data & Weights License): 2025 eingeführt – eine umfassende, permissive Lizenz für Modellcode, -gewichte, Datensätze, Dokumentation und Software („Model Materials“). Ziel ist Klarheit und Einheitlichkeit durch eine einzelne Lizenz für alle Modellbestandteile – inklusive ausdrücklicher Rechteübertragungen (Urheberrecht, Patent, Datenbank, Geschäftsgeheimnisse) und ohne Kombinieren mehrerer Lizenzen.

Datenspezifische Lizenzen

  • CDLA-Permissive-2.0: Für Datensätze

  • ODC-By: Für Datenbanken

Creative Commons (für Daten und Modelle)

  • CC0: Gemeinfreiheit – keine Einschränkungen

  • CC BY: Namensnennung erforderlich

  • CC BY-SA: Abgeleitete Werke müssen unter gleichen Bedingungen veröffentlicht werden

  • CC BY-NC: Keine kommerzielle Nutzung erlaubt

  • CC BY-ND: Keine Bearbeitung oder abgeleitete Werke erlaubt

Hinweis: Creative-Commons-Lizenzen sind nicht geeignet für Software-Code, da sie wichtige Bestandteile wie Patentklauseln oder Anforderungen an Quellcodeoffenlegung und Weiterverteilung nicht abdecken. Sie eignen sich stattdessen für Datensätze, Dokumentation und andere nicht-codebasierte Inhalte.

Vergleich von Lizenzmerkmalen

  • Permissive Lizenzen (MIT, BSD, Apache) ermöglichen proprietäre Nutzung mit geringen Auflagen. Apache 2.0 bietet zudem Patentschutz.

  • Copyleft-Lizenzen (GPL, MPL) garantieren Offenheit bei Weiterentwicklungen. Die GPL stellt sicher, dass alle Ableitungen frei bleiben.

  • Modellspezifische Lizenzen (OpenMDW, OpenRAIL) bieten maßgeschneiderte Regelungen für KI-Modelle, verantwortungsvollen Umgang, und bei OpenMDW eine einheitliche Lizenzierung für Code und Nicht-Code-Komponenten.

Namensnennung und Einbindung von Lizenzhinweisen sind bei allen anerkannten FOSS-Lizenzen obligatorisch, insbesondere bei Weiterverwendung.

Wahl der Lizenz: Vor- und Nachteile je nach Projekttyp

  • Kommerzielle Software: Bevorzuge permissive Lizenzen – größtmögliche Kompatibilität mit proprietären/kommerziellen Anwendungen.

  • Interne Tools: Lizenzwahl weniger kritisch – es sei denn, eine externe Verteilung ist geplant.

  • KI-Entwicklung: Permissive Lizenzen weiterhin dominant, aber modellspezifische Lizenzen wie OpenMDW und OpenRAIL gewinnen an Bedeutung – insbesondere wegen umfassender Rechte und verantwortungsvoller Nutzung. Striktes Copyleft kann in der Industrie abschreckend wirken.

  • Community-Projekte: Copyleft fördert Rückflüsse an die Community; permissive Lizenzen ziehen breitere Mitwirkung an (auch von Unternehmen).

Urheberrecht in der EU vs. USA

  • Urheberschaft & Originalität: EU verlangt eine „eigene geistige Schöpfung“; USA haben geringere Anforderungen („kreative Leistung“).

  • Eigentum an Werken: In der EU halten Arbeitgeber in der Regel die wirtschaftlichen Rechte; in den USA greift die „work for hire“-Regel – mit vertraglichen und nationalen Ausnahmen.

  • KI-generierte Werke: Beide Regionen fordern menschliche Urheberschaft. Die EU erlaubt Ausnahmen für Text-/Daten-Mining – Rechteinhaber können widersprechen. In den USA greift die Fair-Use-Doktrin – offener, aber rechtlich unsicherer.

  • Schutzdauer: Üblicherweise Lebenszeit des Autors plus 70 Jahre (mit Ausnahmen für Firmenwerke in den USA).

  • Urheberpersönlichkeitsrechte: In der EU stärker ausgeprägt (z. B. Recht auf Namensnennung und Werkintegrität); in den USA eingeschränkt und oft verzichtbar.

KI-Training und Daten: Jurisdiktionsübergreifende Fragestellungen

  • EU: Klare Urheberrechtsausnahmen für KI-Training/Datenanalyse – Rechteinhaber können aktiv widersprechen.

  • USA: Weit gefasste, aber weniger klar definierte Fair Use-Regeln gelten für Modell-/Datentraining.

  • Patentrechte: Besonders relevant in den USA. Apache 2.0 und OpenMDW enthalten ausdrückliche Patentfreigaben – reduzieren das Risiko von Rechtsstreitigkeiten.

Fazit

Bei der Wahl einer Open-Source-Lizenz für Software oder KI-Modelle solltest du den Typ des Assets (Code, Daten, Modell, Dokumentation), rechtliche Risiken (z. B. Patente), Projektziele und länderspezifische Besonderheiten beim Daten-/Modelltraining berücksichtigen.

Für moderne KI-Projekte bieten modellspezifische Lizenzen wie OpenMDW zunehmend die besten Vorteile: breite Nutzungsrechte, klare rechtliche Absicherung und Einfachheit durch eine einheitliche Lizenz für alle Komponenten – ohne Lizenz-Wirrwarr.

Haftungsausschluss:
Die Inhalte dieses Blogs dienen ausschließlich allgemeinen Informationszwecken und stellen keine Rechtsberatung dar. Obwohl wir uns bemühen, die Informationen aktuell und korrekt zu halten, können sie nicht die neuesten rechtlichen Entwicklungen oder die spezifische Situation Ihres Unternehmens berücksichtigen. Leser sollten auf Grundlage der hier bereitgestellten Informationen nicht handeln, ohne vorher professionelle Rechtsberatung einzuholen. Durch die Nutzung oder das Vertrauen auf die Inhalte dieses Blogs entsteht kein Mandatsverhältnis