Schlagwortarchiv für: Fall des Monats

Welche Inhalte dürfen fürs Training von Sprachmodellen verwendet werden? – Fall des Monats April ’25

Das Team der Rechtsinformationsstelle ORCA.nrw unterstützt Lehrende aus Nordrhein-Westfalen bei rechtlichen Fragen. Im Format „Fall des Monats“ stellt es regelmäßig einen besonderen Sachverhalt vor, der sich aus einer zu bearbeitenden Anfrage oder aus aktueller Rechtsprechung ergibt.

Ausgangspunkt

Diese Ausgabe befasst sich mit der Eingabe von CC-lizenzierten Inhalten in Sprachmodellen zum Zwecke ihres Trainings. Sprachmodelle, sog. Large Language Models, sind in der Lage natürliche Sprache zu verstehen und zu generieren. Sie beruhen auf einem statistischen Modell, das Muster in Text- oder Sprachdaten identifiziert und diese nutzt, um Vorhersagen für zukünftige Texte oder Sprachdaten zu treffen, sie gelten daher als Künstliche Intelligenzen (KI) (https://www.intel.de/content/www/de/de/learn/large-language-models.html, letzter Aufruf: 16.04.2025). Um zuverlässige Ergebnisse zu erlangen, müssen diese Large Language Models trainiert werden, was unter anderem durch die Eingabe von Rohdaten geschieht. Es stellt sich die Frage, welche Inhalte für das Training verwendet werden dürfen. Hierbei wird ein Blick auf die relevanten CC-Lizenzen sowie auf möglicherweise einschlägige Schrankenregelungen geworfen.


Rechtliche Bewertung

Die Eingabe von Inhalten zum Training von Sprachmodellen ist regelmäßig als Eingriff in das urheberrechtliche Vervielfältigungsrecht anzusehen (1.). Bestehen keine Nutzungsrechte, so sind die Text- und Data-Mining-Schranke aus § 44b UrhG (2a.) und die Schranke für Text und Data Mining zum Zwecke der wissenschaftlichen Forschung aus § 60 d UrhG (2b.) zu prüfen. Hierzu wurde im September 2024 ein erstes Urteil vom Landgericht Hamburg verkündet.

1. Vervielfältigungen und Nutzungsrechte

Dem Urheber stehen die Verwertungsrechte für sein Werk zu, vgl. § 15 UrhG. Jede Nutzung, die das Verwertungsrecht des Urhebers einschränkt, ist ein Eingriff. Dieser kann rechtmäßig sein, wenn der Urheber gem. § 31 I UrhG Nutzungsrechte eingeräumt hat, Rechtfertigungsgründe vorliegen oder eine gesetzlich geregelte Schranke einschlägig ist. Die Eingabe von Werken in eine KI stellt einen Eingriff in die urheberrechtlichen Verwertungsrechte nach § 15 I UrhG dar, genauer einen Eingriff in das Vervielfältigungsrecht gem. § 16 UrhG des Urhebers (NJW; 2023, 3673 ff., Rn. 31). Nutzungsrechte ergeben sich in der Regel aus den Lizenzangaben. Die Nutzung ist bei Werken, die unter einer CC-0-, CC-BY- oder CC-BY-SA-Lizenz (https://www.orca.nrw/oer/oer-nutzen/cc-lizenzen/) veröffentlicht wurden unproblematisch, da die entsprechende Nutzung von der Lizenz umfasst ist. Bei Werken, die unter einer CC-BY-NC, CC-BY-NC-SA, CC-BY-ND oder CC-BY-NC-ND veröffentlicht wurden, ist die Nutzung nicht von der Lizenz gedeckt. Hier muss geklärt werden, ob die Nutzung durch gesetzliche Schranken ermöglicht wird.

2. Schranken

Eine urheberrechtliche Schranke ist eine gesetzliche Gestattung der Nutzung von urheberrechtlich geschützten Werken, die nicht der Zustimmung des Urhebers bedarf. Beim Training von Sprachmodellen könnten zwei Schranken einschlägig sein. Ob diese Schranken tatsächlich anwendbar sind, ist derzeit jedoch noch sehr umstritten.


a. § 44b UrhG – Text und Data Mining
Nach § 44b UrhG dürfen zur automatisierten Analyse von digitalen und digitalisierten Werken, also zur
Muster- und Informationengewinnung, Werke vorübergehend vervielfältigt werden. Hier gelten weitere
gesetzliche Grenzen, die bei der Eingabe von Inhalten beachtet werden müssen. Das Werk, das der Nutzer in die KI eingeben möchte, muss rechtmäßig zugänglich sein (vgl. § 44b Abs. 2 UrhG). Diese Voraussetzung liegt vor, wenn ein Werk frei im Internet zugänglich ist oder wenn der Nutzer rechtmäßig einen Zugang erhalten hat, z.B. über den lizenzierten Zugang einer Universitätsbibliothek (NJW, 2023, 3673 ff., Rn. 18). Außerdem darf nach Abs. 3 kein maschinenlesbarer Nutzungsvorbehalt vorliegen. Die Vervielfältigungen sind zu löschen, wenn sie nicht mehr für das Text und Data Mining erforderlich sind.


b. § 60d UrhG – Text und Data Mining für Zwecke der wissenschaftlichen Forschung

Darüber hinaus könnte der § 60d UrhG als Schranke greifen, wenn die Vervielfältigungen im Rahmen des Text und Data Mining für Zwecke der wissenschaftlichen Forschung genutzt werden. Der § 60d UrhG orientiert sich am § 44b UrhG, weist aber weitere Grenzen auf, um dem wissenschaftlichen Austausch und der Innovation gerecht zu werden. Die Schranke des § 60d UrhG ist demnach auch nur im Bereich der wissenschaftlichen Forschung anwendbar. Im Vergleich zu § 44b UrhG gelten z.B. nicht die Grenzen des rechtmäßig zugänglichen Werkes oder des ausdrücklichen Nutzungsvorbehalts (s.o.). Ob ein Fall der Schranke des § 60d UrhG auch beim Training von Sprachmodellen vorliegt, ist dann zusätzlich vom Zweck des Trainings entscheidend. Das Sprachmodell und das Training müssen der wissenschaftlichen Forschung dienen. Wissenschaftliche Forschung bezeichnet allgemein das methodisch-systematische Streben nach neuen Erkenntnissen (Dreier/Schulze/Dreier, 7. Aufl. 2022, UrhG § 60c Rn. 1). Nicht nur die unmittelbar mit der Erkenntnisgewinnung verbundenen Arbeitsschritte werden erfasst, sondern auch mittelbare Schritte, also solche die auf einen späteren Erkenntnisgewinn gerichtet sind. Dazu gehören z.B. Datensammlungen, um anschließend empirische Schlussfolgerungen zu ziehen. Ein späterer Forschungserfolg wird nicht vorausgesetzt. In einem ersten Urteil hat das Landgericht Hamburg im September 2024 entschieden, dass das Training von KI einen Fall des Text und Data Mining darstellt und unter den Voraussetzungen des § 60d UrhG zulässig ist. Hier klagte ein Fotograf gegen einen gemeinnützigen Verein (LAION e.V.). LAION e.V. entwickelt selbstlernende Algorithmen im Sinne künstlicher Intelligenz fort und stellt diese der breiten Öffentlichkeit zur Verfügung. LAION e.V. hält kostenfrei Datensätze und Modelle bereit, erstellt und testet eigene KI-Modelle auf Basis der Trainingsdaten (https://laion.ai/about/, letzter Aufruf: 16.04.2025). Der Verein fand ein Foto auf der Webseite Bigstock, auf welcher der Fotograf sein Werk zur Verfügung gestellt hatte, und nutzte dieses für die Erstellung eines Trainingssatzes – LAION 5B. Das LG Hamburg entschied, dass es sich bei dieser Vervielfältigung zur Erstellung eines Trainingsdatensatzes um Text und Data Mining für Forschungszwecke i.S.d. § 60d UrhG handelt (LG Hamburg, Urt. v. 27.9.2024 – 310 O 227/23, Rn. 54). Zur Argumentation führte das LG unter anderem auf, dass in der Gesetzesbegründung von § 60d UrhG das maschinelle Lernen als Basis-Technologie für KI als besonders wichtig eingestuft wurde (BT-Drs. 19/27426, S. 60). Dies ist jedoch bloß eine erstinstanzliche Entscheidung, die derzeit in Berufung ist. Es besteht demnach weiterhin Rechtsunsicherheit.


Fazit

Die Eingabe von lizenzierten Werken in ein Sprachmodell zu Trainingszwecken stellt eine Vervielfältigung dar, die in die Nutzungsrechte des Urhebers eingreift. Diese Nutzung kann jedoch rechtmäßig sein, wenn entweder die Nutzung durch eine entsprechende Lizenz (CC-0, CC-BY oder CC-BY-SA) erlaubt ist oder die Text- und Data-Mining-Schranke greift. Letzteres bleibt jedoch strittig. Die derzeitige Rechtsprechung tendiert zwar zu einer Anwendbarkeit, hat aber bislang noch wenig Aussagekraft. Hier muss die höchstrichterliche Rechtsprechung abgewartet werden. Aus diesem Grund empfiehlt es sich derzeit, nur entsprechend (CC-)lizenzierte Werke zum Training von KI zu verwenden.

Ist eine Collage urheberrechtlich zulässig? – Fall des Monats März ’25

Herzlich willkommen zur neuen Rubrik der Rechtsinformationsstelle von ORCA.nrw. Das Team der Rechtsinformationsstelle unterstützt Lehrende aus Nordrhein-Westfalen bei rechtlichen Fragen. Im Format „Fall des Monats“ stellt es nun regelmäßig einen besonderen Sachverhalt vor, der sich aus einer zu bearbeitenden Anfrage oder aus aktueller Rechtsprechung ergibt.

Ausgangspunkt

Diese Erstauflage befasst sich mit der urheberrechtlichen Zulässigkeit einer Collage, die sich aus fremden urheberrechtlich geschützten Werken zusammensetzt. Eine Collage ist dabei eine künstlerische, literarische oder musikalische Ausdrucksform, die aus mehren zusammengefügten Elementen besteht (vgl. https://www.duden.de/rechtschreibung/Collage, letzter Abruf: 11.03.2025).

Rechtliche Bewertung

Auf rechtlicher Ebene stellt sich zunächst die Frage, ob die Einbindung eines fremden Werkes in eine Collage als eine freie Benutzung oder als eine zustimmungsbedürftige Bearbeitung einzuordnen ist (1.). Da es sich bei einer Collage regelmäßig um eine zustimmungsbedürftige Bearbeitung handeln dürfte, ist deren Zulässigkeit aufgrund des Zitatrechts (2.) oder als Pastiche (3.) zu prüfen.

1. Keine freie Benutzung gem. § 23 Abs. 1 S. 2 UrhG

Die Einarbeitung eines Werkes in eine Collage dürfte regelmäßig eine zustimmungsbedürftige Bearbeitung gemäß § 23 Abs. 1 S. 1 UrhG sein. Gemäß § 23 Abs. 1 S. 2 UrhG liegt eine freie Benutzung nur vor, wenn die Collage als neues Werk einen hinreichenden Abstand zu dem genutzten Originalwerk darstellt. Bei der Abgrenzung kommt es stets auf den Einzelfall an. Dabei stehen die Übereinstimmungen, nicht die Unterschiede der zu vergleichenden Werke im Vordergrund. Ein hinreichender Abstand liegt nicht vor, wenn das neue Werk auch weitere, abweichende Elemente enthält. (Wandtke/Bullinger/Bullinger, 6. Auflage 2022, § 23 UrhG, Rn.36 und 38). Bei der Erstellung einer Collage wird das Originalwerk mit weiteren Elementen zusammengesetzt. Dementsprechend hat das OLG Köln schon 1997 eine freie Benutzung verneint, wenn aus dem Werkfundus eines Künstlers verschiedene urheberrechtlich geschützte Elemente herausgegriffen und neu kombiniert werden (OLG Köln, Urteil vom 10. 1. 1997 – 6 U 94–96, NJW 1998, 1416).

2. Kein Zitat

Die Einarbeitung eines Werkes in eine Collage dürfte auch nicht als Zitat gemäß § 51 S. 1 UrhG gerechtfertigt sein, obwohl neben dem Textzitat und dem Musikzitat selbst die Übernahme von Bildwerken auch zu nicht-wissenschaftlichen Zwecken vom Zitatrecht als sog. Bildzitat gedeckt sein kann (Dreier/Schulze/Dreier, 7. Auflage 2022, § 51 UrhG, Rn.24 m. w. N.). Allerdings müsste die Übernahme der anderen Werke in ein selbstständiges Werk erfolgen, vgl. § 51 Nr. 1-3 UrhG. Selbstständig ist ein Werk nur, wenn es sich nicht um die Bearbeitung oder andere Umgestaltung des zitierten Werkes handelt (Dreier/Schulze/Dreier, 7. Auflage 2022, § 51 UrhG, Rn.7 m. w. N. und Wandtke/Bullinger/Lüft, 6. Auflage 2022, § 51 UrhG, Rn.8). Bei einer Collage dürften die Einzelteile wegen des neuen Kontextes als Bearbeitungen anzusehen sein (s.o. 1.).

3. Mögliche Pastiche

Die Collage könnte aber als Pastiche gemäß § 51a S. 1 UrhG zulässig sein, der aus den übernommenen Werken zusammengesetzt ist. Der Begriff Pastiche stammt aus dem Unionsrecht und wurde erst vor einigen Jahren ins deutsche Recht umgesetzt, weshalb dieser noch weitgehend ungeklärt ist. So gibt es in der Literatur Stimmen, die ausdrücklich die Collage als mögliche Form des Pastiche nennen (vgl. Dreier/Schulze/Dreier, 7. Auflage 2022, § 51a UrhG, Rn.20 m. w. N). Die Entscheidung eines Obergerichts steht aber bislang noch aus. In einer der ersten Gerichtsentscheidungen hat das LG Berlin den Begriff wie folgt umschrieben:

Bei dem Pastiche geht es demnach um einen kommunikativen Akt der stilistischen Nachahmung, wobei auch die Übernahme fremder Werke oder Werkteile erlaubt ist. Der Pastiche setzt eine bewertende Referenz auf ein Original voraus […]. Das ältere Werk muss in Abgrenzung zum unzulässigen Plagiat so benutzt werden, dass es in einer veränderten Form erscheint. Dazu reicht es aus, dem Werk andere Elemente hinzuzufügen oder das Werk in eine neue Gestaltung zu integrieren […]. Da die Schranke der Meinungs- und Kunstfreiheit dient, ist ein Mindestmaß eigener Kreativität des Begünstigten erforderlich, ohne dass dabei die für eine Urheberrechtsschutzfähigkeit erforderliche Schöpfungshöhe erreicht werden muss. (LG Berlin, Urteil vom 2.11.2021 – 15 O 551/19, The Unknowable, ZUM-RD 2022, S. 498, Rn. 37.)

Die Formulierung des LG Berlin legt nahe, eine Collage als einen Pastiche anzusehen. Allerdings ist noch nicht gesagt, dass sich auch Obergerichte dieser Sichtweise anschließen werden. Dieses Risiko sollte man sich vor Veröffentlichung einer Collage bewusst machen. Ungeachtet der Einordnung als Pastische müsste eine Collage auch die weiteren unionsrechtlichen Nutzungsvoraussetzungen erfüllen. Gemäß Art. 5 Abs. 5 Info-Soc-RL darf eine Ausnahme wie ein Pastiche nur in den Fällen erfolgen

a) in denen die normale Verwertung des Werks oder des sonstigen Schutzgegenstands nicht beeinträchtigt wird

b) und die berechtigten Interessen des Rechtsinhabers nicht ungebührlich verletzt werden.

Hierbei ist eine Interessenabwägung im Einzelfall anzustellen. Bei dieser ist das Urheberrecht am jeweiligen Originalwerk mit der Kunstfreiheit des Schöpfers der Collage als Pastiche abzuwägen (BeckOK UrhR/Lauber-Rönsberg, 44. Edition 01.11.2024, § 51a UrhG, Rn.20). Je mehr der Kunstcharakter einer Collage gegenüber kommerziellen Interessen hervortritt, umso eher wird hier die Interessenabwägung zugunsten der Zulässigkeit der Collage ausfallen. Doch auch hier verbleibt ein Restrisiko, dass sich auch im Zweifelsfall das erkennende Gericht dem anschließt.

Fazit

Die Collage dürfte eine Bearbeitung sein, die weder der freien Benutzung unterliegt und auch nicht vom Zitatrecht gedeckt ist (s.o. 1. und 2.). Die Collage könnte aber ein Pastiche sein, wobei die Rechtslage zu diesem Begriff bislang ungeklärt ist (3.). Zudem sind die weiteren unionsrechtlichen Voraussetzungen zu beachten. Auch bei diesen verbleibt ein Restrisiko, weil die Rechtmäßigkeit der Werknutzungen von einer Interessenabwägung im Einzelfall abhängt.