Text Link

Wie «open» sind Open Source AI-/LLM-Tools?

Vanessa
Written by
Vanessa
11.4.2025

Wir haben die Schlagzeilen im Januar alle gelesen: «DeepSeek – Open Source-Konkurrenz zu OpenAI und anderen LLM’s». Doch was heisst Open Source im Kontext von AI-/LLM-Tools überhaupt und wie «open» sind die Tools tatsächlich?

Der Begriff «Open Source» ist aus der Softwareentwicklung bekannt: Er bezeichnet Programme, deren Quellcode grundsätzlich frei zugänglich ist, die beliebig genutzt, verändert und weiterverbreitet werden dürfen. Dabei gibt es verschiedene Arten von Open Source Lizenzen, wobei bei gewissen die Nutzung völlig ohne Einschränkungen möglich ist (sog. «permissive open source license») während bei anderen Einschränkungen bestehen, z.B. in Bezug auf die kommerzielle Nutzung oder durch die Bedingung, dass Weiterentwicklungen wiederum der Allgemeinheit zur Verfügung gestellt werden müssen (oft als sog. «restrictive open source licenses» bezeichnet).

Mit dem Aufkommen von Künstlicher Intelligenz (KI) und insbesondere von Large Language Models (LLMs) gewinnt «Open Source» jedoch eine neue Dimension. Hier geht es nicht nur um den Code, sondern auch um Trainingsdaten, Modellgewichte (also das «Gedächtnis des Modells») und Architektur. Das führt zu Missverständnissen und Unklarheiten darüber, wie «offen» ein AI- resp. LLM-Modell tatsächlich ist.

Was bedeutet «Open Source» im Kontext von KI?

«Open Source» kann im KI-Kontext unterschiedlich ausgelegt werden kann. Viele als «Open Source» bezeichnete KI-Modelle geben lediglich die Modellgewichte frei, während Trainingsdaten und Trainingsprozesse meistens proprietär bleiben.

Es besteht keine allgemeingültige Begriffsdefinition für Open Source im KI-Kontext. Hilfreich sind aber beispielsweise die Definitionen der Open Source Initiative (OSI) oder der Linux Foundation.

Linux Foundation: Das Model Openness Framework (MOF) der Linux Foundation bietet eine detaillierte Klassifikation und unterscheidet drei Offenheitsstufen basierend auf der Verfügbarkeit von Komponenten wie Modellparametern, Trainingscode und Datensätzen.

Open Source Initiative: Die OSI definiert Open-Source-AI als Systeme, die frei genutzt, studiert, modifiziert und weiterverbreitet werden können. Sie betont, dass alle Aspekte des Systems zugänglich sein müssen, ohne Einschränkungen für kommerzielle oder private Nutzung.

Warum ist das wichtig für dein Unternehmen?

Für Unternehmen, die KI-Tools kommerziell nutzen oder gar weiterentwickeln möchten, ist es entscheidend zu verstehen, welche Rechte und Pflichten mit der Nutzung solcher Modelle verbunden sind. Nicht alle als «Open Source» bezeichneten KI-Modelle erlauben uneingeschränkte kommerzielle Nutzung, Modifikation oder Weiterverbreitung. Ein genaues Prüfen der Lizenzbedingungen ist daher unerlässlich.

Checkliste: Worauf solltest du achten?

  1. Verstehe das Produkt: Analysiere, ob das KI-Tool deinen geschäftlichen Anforderungen entspricht und welche Funktionen es bietet.
  2. Vergleiche verschiedene Quellen: Es kann vorkommen, dass auf Plattformen wie GitHub Versionen eines Tools verfügbar sind, welche unter anderen Lizenzbedingungen veröffentlicht wurden als auf der offiziellen Website des Anbieters.
  3. Prüfe die Lizenzbedingungen: Du solltest die Lizenzbedingungen sehr sorgfältig durchlesen. Stelle dabei unbedingt sicher, dass du die aktuellsten und gültigen Bedingungen kennst. Achte insbesondere darauf, ob die Lizenz kommerzielle Nutzung, Modifikation und Weiterverbreitung erlaubt.

    Kommerzielle Nutzung:
    Zunächst gilt es zu unterscheiden, ob du «nur» den Output kommerziell nutzen möchtest und/oder das KI-/LLM-Tool als solches. Anhand dessen musst du prüfen, ob für deine gewollte Anwendung die kommerzielle Nutzung erlaubt ist.

    Sog. permissive Lizenzen erlauben die kommerzielle Nutzung des Tools beispielsweise häufig mit einem Wortlaut wie folgt oder ähnlich: «You are free to use, modify, distribute, and sell the software and its outputs for any purpose, including commercial use, without restrictions, provided that the original copyright notice and disclaimers are retained».

    Bestimmt die Lizenz hingegen beispielsweise. «You may apply the Outputs for personal use, academic research, or derivative product development but not for commercial purposes without explicit consent», ist sogar die kommerzielle Nutzung des Outputs bereits nicht frei gestattet.

    Modifikation und Weiterverbreitung:
    Formulierungen wie «You may modify, distribute, and use the software under the terms of this License» bedeuten in der Regel, dass Modifikationen und Weiterverbreitung grundsätzlich erlaubt sind.

    Dagegen bestimmen Formulierungen wie «You will not copy, transfer, lease, lend, sell, or sublicense the entire or part of the Services without […]’s authorization» oder auch «You will not engage in activities to steal network data, such as: reverse engineering, reverse assembly, reverse compilation, translation, or attempting to discover the source code, models, algorithms, and system source code or underlying components of the software», dass Modifikation und Weiterverbreitung ohne ausdrückliche Erlaubnis verboten sind.
  4. Achte auf Einschränkungen: Viele Tools erlauben zwar die freie kommerzielle Nutzung (mindestens des Outputs), unterstellen diese aber gewissen Einschränkungen. Auch permissive Lizenzen wie die Apache 2.0-, die MIT- oder die OpenRAIL-M-Lizenz, sehen solche Restrictions vor. Diese sind in den Lizenzbedingungen beispielsweise wie folgt erkennbar:
    • Weiterverbreitung nur unter gleicher Lizenz (Copyleft-Prinzip): «If you distribute a modified version, you must license it under the same terms as this License.»
    • Namensnutzung untersagt: «You may not use the name, trademarks, or logos of the original authors without prior written permission.»
    • Namensnennung erforderlich: «You must retain the original copyright notice and attribution in all copies or substantial portions of the software.»
  5. Kläre Haftungsfragen: Viele Open Source-Lizenzen schliessen Haftung und Gewährleistung aus. Überlege, wie du mit möglichen Risiken umgehen möchtest und ob zusätzliche Vereinbarungen oder Versicherungen erforderlich sind.
  6. Dokumentiere deine Nutzung: Führe Aufzeichnungen darüber, welche Open Source-Komponenten du verwendest, welche Lizenzen gelten und wie du die Lizenzbedingungen einhältst.

Fazit und Take Away

Die Nutzung von Open Source-KI-Tools bietet viele Vorteile, erfordert jedoch auch ein sorgfältiges Verständnis der jeweiligen Lizenzbedingungen. Auch wenn ein KI-Tool als «Open Source» beworben wird, solltest du zunächst prüfen, ob es für die Bedürfnisse deines Unternehmens tatsächlich ausreichend «open» ist. Durch eine gründliche Prüfung und Beachtung der oben genannten Punkte kannst du rechtliche Fallstricke vermeiden und das volle Potenzial dieser Technologien sicher ausschöpfen. Falls du eine Übersicht über die wichtigsten Lizenzbedingungen der bekanntesten KI-Tools wünschst, dann kannst du uns gerne eine E-Mail senden.

Wir haben die Schlagzeilen im Januar alle gelesen: «DeepSeek – Open Source-Konkurrenz zu OpenAI und anderen LLM’s». Doch was heisst Open Source im Kontext von AI-/LLM-Tools überhaupt und wie «open» sind die Tools tatsächlich? Mit dem Aufkommen von Künstlicher Intelligenz (KI) und insbesondere von Large Language Models (LLMs) gewinnt «Open Source» eine neue Dimension. Hier geht es nicht nur um den Code, sondern auch um Trainingsdaten, Modellgewichte (also das «Gedächtnis des Modells») und Architektur. Das führt zu Missverständnissen und Unklarheiten darüber, wie «offen» ein AI- resp. LLM-Modell tatsächlich ist.