2023

KI und Urheberrecht aus Sicht der Verwerter – KI-Training mit Inhalten aus dem eigenen Rechterepertoire

Zurück
von Prof. Dr. Jan Bernd Nordemann und Jonathan Pukas

ansprechpartner

Der zunehmende Einsatz künstlicher Intelligenz (KI) wirft nicht nur viele gesellschaftliche Fragen auf. Er betrifft auch alle, die sich mit dem Urheberrecht auseinandersetzen müssen. Hierzu gehören auch Verwerter wie Filmproduzenten oder Games-Publisher. In einem vorherigen Blogpost (Transparenzbedarf in Lizenz- und Nutzungsverträgen) haben wir uns bereits mit der Frage auseinandergesetzt, welche Transparenzpflichten aufgrund des Einsatzes von KI in Nutzungsverträge zwischen Verwerter und Urheber aufgenommen werden sollen. Ein weiteres wichtiges Thema ist darüber hinaus das Training von KI mit urheberrechtlich geschützten Inhalten.

Künstliche neuronale Netze, auf denen heutzutage die meisten KI-Anwendungen basieren, müssen mit einer großen Menge an Trainingsdaten gefüttert werden, bevor sie einsatzbereit sind. Denn ihre Arbeitsweise beruht auf einem Verfahren maschinellen Lernens. Die KI lernt also selbst die in der später folgenden Anwendungsphase benötigten Regeln „bottom up“ aus einer Vielzahl von Beispielsfällen. GPT-3, das ChatGPT zugrundeliegende Sprachmodell, wurde mit 300 Milliarden Wörtern trainiert. Zu den erforderlichen Datensätzen gehören insbesondere beim Training generativer KI, also solcher KI-Systeme, die konsumierbare Kreativinhalte erzeugen, auch urheberrechtlich geschützte Werke. Sie werden vor allem aus frei zugänglichen Internetquellen mit Hilfe sogenannter Webcrawler heruntergeladen – zumeist ohne ausdrückliche Zustimmung der betreffenden Rechteinhaber. Verwerter können sich hier fragen: Kann ich das steuern?

Im Ergebnis sehen wir folgende To Dos für Rechteverwerter:

  • Wenn kein KI-Training Dritter mit eigenen Inhalten gewünscht ist:
    • technische Schutzmaßnahmen ergreifen
    • Nutzungsvorbehalte erklären
    • Frühzeitig gegen Anbieter öffentlicher Trainingsdatensätze vorgehen, wenn sich hierin die eigenen Inhalte wiederfinden
  • Wenn selbst KI mit eigenen Inhalten trainiert werden soll:
    • In alten Nutzungsverträgen überprüfen, ob unbekannte Nutzungsarten lizenziert worden sind
    • In neue Nutzungsverträge Erlaubnisklausel einbauen

Und weshalb diese ToDos?

KI-Training Dritter mit Inhalten des eigenen Repertoires unter Umständen rechtmäßig möglich 

Ob und wenn ja unter welchen Voraussetzungen Rechtsinhaber und insbesondere Verwerter das KI-Training Dritter auf Basis ihrer urheberrechtlich geschützten Werke hinnehmen müssen, richtet sich vor allem nach der neu eingeführten Schrankenbestimmung für Text und Data-Mining (§ 44b UrhG). Auch wenn hier vieles noch ungeklärt ist, muss wohl davon ausgegangen werden, dass die Regelung auch das Abspeichern fremder Werke für das Training von KI umfasst.

Gegen das Sammeln eigener Werke als Trainingsdaten kann aber ein Nutzungsvorbehalt erklärt werden

Wenn Verwerter die Nutzung ihrer Werke durch Dritte für das Training von KI verhindern wollen, haben sie allerdings die Möglichkeit, einen Nutzungsvorbehalt zu erklären. Wird dieser in Übereinstimmung mit den gesetzlichen Vorgaben umgesetzt, beendet er die Wirkung der Schrankenbestimmung. Welche Voraussetzungen der Nutzungsvorbehalt genau erfüllen muss, ist im Detail aber noch unklar. Es empfiehlt sich daher, einen mehrgleisigen Ansatz zu wählen und den Nutzungsvorbehalt auf verschiedene Art und Weisen und an verschiedener Stelle in die eigene Webseite zu integrieren. In jedem Fall wirkt der Vorbehalt allerdings nur gegen kommerzielles Sammeln von KI-Trainingsdaten. Nicht-kommerzielle Forschungseinrichtungen können von einer weiteren Schrankenbestimmung, § 60d UrhG, profitieren, deren Wirkung nicht durch einen Nutzungsvorbehalt beendet werden kann.

Ein Problem bei der Schrankenbestimmung für Text und Data Mining ist aber dennoch, dass für das Eingreifen der Schrankenbestimmung nicht vorausgesetzt wird, dass die Inhalte dem Trainingsdatensammler im Internet urheberrechtskonform zur Verfügung gestanden haben. Aus seiner Sicht ist allein ausreichend, dass er freien Zugang zu den Daten gehabt hat, also keine Schutzmechanismen überwinden musste. Wenn Werke damit urheberrechtswidrig Teil eines öffentlichen zugänglichen Trainingsdatensatzes geworden sind, können die Werke als Teil dieses KI-Trainingsdatensatzes urheberrechtskonform auf Basis der Schrankenbestimmung aus § 44b UrhG heruntergeladen werden. Wenn dies von Rechtsinhabern und insbesondere Verwertern nicht gewollt ist, müssen sie daher frühzeitig gegen die Uploader der Trainingsdatensätze vorgehen.

Training eigener KI mit Werken des eigenen Repertoires

Andererseits können Verwerter auch ein Interesse an der Entwicklung eigener KI haben. Hierfür benötigen sie ebenfalls eine große Menge Trainingsdaten. Da sie in der Regel über ein erhebliches Werkrepertoire verfügen, stellt sich für sie die Frage, ob sie ihr eigenes Repertoire zum Training ihrer eigenen KI nutzen dürfen. Entscheidend ist hier die konkrete Ausgestaltung der mit den Urhebern abgeschlossenen Lizenzverträge.

In jedem Fall ist das KI-Training eine eigenständige Nutzungsart, die somit auch speziell lizenziert werden kann. Dies ist für den Verwerter, der eine eigene KI entwickeln will, nicht vorteilhaft, da die Nutzungsrechte nach allgemeinen urheberrechtlichen Grundsätzen stets weitestmöglich beim Urheber verbleiben. Damit das Recht zur Nutzung von Werken für das Training von KI auf den Verwerter übergeht, muss er in den Lizenzverträgen daher bestmöglich ausdrückliche Regelungen für das KI-Training getroffen haben.

Es ist aber auch möglich, dass sich aus dem Vertragszweck ergibt, dass das Training von KI in die Rechteeinräumung einbezogen werden soll. Wenn den Verwertern darüber hinaus ausdrücklich die Rechte an zum Zeitpunkt des Vertragsschlusses unbekannten Nutzungsarten eingeräumt wurden, ist es wahrscheinlicher, dass Verwerter ihr Repertoire auch für das Training von KI nutzen dürfen. Denn für die Einräumung unbekannter Nutzungsarten gibt es Sonderregeln, die den Verwertern hier tendenziell zugutekommen. Ob das KI-Training damit vom Lizenzvertrag umfasst ist, hängt alles in allem und wie üblich vom berühmten Einzelfall ab.

Verwerter, die sich mit dem Training eigener KI beschäftigen, sollten aber nicht zu früh den Kopf in den Sand stecken. Schließlich können auch sie von der Schrankenbestimmung für Text und Data-Mining (§ 44b UrhG) profitieren. Außerdem ist der eigentliche Trainingsvorgang nach allgemeinen urheberrechtlichen Grundsätzen wohl keine urheberrechtlich relevante Nutzungshandlung. Ließe sich das Training demzufolge realisieren, ohne dass neue Vervielfältigungen der Werke angefertigt werden, könnte es sein, dass es überhaupt keiner weiteren Nutzungsrechte bedarf. Letztlich hängt das von der konkreten Ausgestaltung des Trainingsverfahrens aus einer technischen Perspektive ab. Auch das ist also einzelfallabhängig.

Was sollen Verwerter jetzt tun?

Alles in allem ist auch das KI-Training für Rechteverwerter ein wichtiges Thema. Soll KI mit dem eigenen Repertoire trainiert werden, sollten die Nutzungsverträge mit den Urhebern im Hinblick auf das KI-Training überarbeitet werden. Auch wenn die Verwerter gegebenenfalls von der Freistellungwirkung der neuen Schrankenbestimmung für Text und Data-Mining (§ 44b UrhG) profitieren können, ist dies unter anderem aus Gründen der Rechtsicherheit zu empfehlen. Das Training Dritter mit eigenen Inhalten, die sie beispielsweise aus frei zugänglichen Internetquellen heruntergeladen haben, muss hingegen nicht immer geduldet werden. Vielmehr können Nutzungsvorbehalte implementiert werden, die das eigene Rechterepertoire absichern.

Deshalb hier noch einmal zusammenfassend unsere To Dos für Rechteverwerter:

  • Wenn kein KI-Training Dritter mit eigenen Inhalten gewünscht ist:
    • technische Schutzmaßnahmen ergreifen
    • Nutzungsvorbehalte erklären
    • Frühzeitig gegen Anbieter öffentlicher Trainingsdatensätze vorgehen, wenn sich hierin die eigenen Inhalte wiederfinden
  • Wenn selbst KI mit eigenen Inhalten trainiert werden soll:
    • In alten Nutzungsverträgen überprüfen, ob unbekannte Nutzungsarten lizenziert worden sind
    • In neue Nutzungsverträge Erlaubnisklausel einbauen