Antwort (Inhalte Dritter zum Training von KI)

Wie k?nnen zum Training von KI-Systemen urheberrechtlich geschützte Inhalte Dritter rechtssicher verwendet werden?

Für das Training eines KI-Systems werden in der Regel gro?e Datenmengen ben?tigt. Dabei kann es sich um eigene Daten, beispielsweise einer Hochschule oder eines Unternehmens, handeln oder um Datens?tze, die von externen Anbieter:innen zu deren Lizenzbedingungen erworben werden. 

Zudem werden im Internet frei zug?ngliche Daten zum Training von KI-Systemen genutzt. Regelm??ig werden dabei auch urheberrechtlich geschützte Inhalte (z.B. Texte, Bilder, Videos, Musik, Programmcodes) als Trainingsmaterial verwendet. Die im Rahmen des Trainings stattfindende automatisierte Analyse und Auswertung der Eingabe-Trainingsdaten sowie ihre Kategorisierung betrifft den urheberrechtsfreien sogenannten Werkgenuss, vergleichbar mit dem Lesen eines Buchs durch einen Menschen. Die Sammlung und Aufbereitung der Trainingsdaten sowie das Speichern von Trainingsdaten k?nnen jedoch das Vervielf?ltigungsrecht aus § 16 UrhG und das Bearbeitungsrecht aus § 23 UrhG betreffen. Soweit keine urheberrechtlichen Nutzungsrechte für diese Verwertungshandlungen durch die Rechteinhaber:innen gem?? §§ 31 ff. UrhG einger?umt wurden oder eine gesetzliche Schrankbestimmung gem?? §§ 44a ff. UrhG einschl?gig ist, würde eine Urheberrechtsverletzung vorliegen. 

Von einer individuellen Nutzungsrechtseinr?umung durch die Rechteinhaber:innen ist aufgrund der Vielzahl an Trainingsdaten regelm??ig nicht auszugehen.

Als relevante Schrankenbestimmungen kommen die Schranke für vorübergehende Vervielf?ltigungshandlungen gem?? § 44a UrhG, sowie die Schrankenbestimmung des § 44b UrhG und § 60d UrhG für Text und Data Mining in Betracht. § 60d UrhG betrifft dabei nur das Text und Data Mining für Zwecke der wissenschaftlichen Forschung, w?hrend § 44b UrhG auch Vervielf?ltigungen zu kommerziellen Zweckenerm?glicht.



I. Text und Data Mining

Die Anwendbarkeit der Schranke des Text und Data Mining aus § 44b UrhG oder § 60d UrhG auf die Nutzung von urheberrechtlich geschützten Werken zum Trainieren eines KI-Systems ist im juristischen Schrifttum umstritten. ?berwiegend wird davon ausgegangen dass dass Training eines KI-Systems erfasst ist. Das Landgericht Hamburg hat sich als erstes deutsches Gericht mit der urheberrechtlichen Zul?ssigkeit befasstund die Anwendbarkeit des § 44b UrhG ebenfalls bejaht (LG Hamburg, Urteil vom 27. September 2024, Az. 310 O 227/23). Es bleibt aber zum jetzigen Zeitpunkt abzuwarten, ob sich diese Auffassung final durchsetzen wird, so dass die Anwendbarkeit der Schranke des Text und Data Mining auf die Nutzung von urheberrechtlich geschützten Inhalten zum Training eines KI-Systems Rechtsunsicherheiten birgt.

1. Abgrenzung des § 44b UrhG zu § 60d UrhG

Für Vervielf?ltigungen von urheberrechtlich geschützten Material für das Text und Data Mining hat der deutsche Gesetzgeber im Jahr 2018 in § 60d UrhG eine Schranke für Zwecke der wissenschaftlichen Forschung eingeführt und ihr 2021 in § 44b UrhG eine allgemeine Schranke auch für kommerzielle Nutzungen zur Seite gestellt. § 60d UrhG schr?nkt Forscher:innen nicht ein, sich auch auf andere Schranken des UrhG zu berufen, wie eben auch auf die allgemeine Text und Data Mining-Schranke gem?? § 44b UrhG.

§ 44b Absatz 1 UrhG enth?lt die Legaldefinition des Text und Data Mining, auf die auch § 60d Absatz 1 UrhG unter Bezugnahme auf § 44b Absatz 1 und 2 Satz 1 UrhG verweist. Text und Data Mining wird definiert als ?die automatisierte Analyse von einzelnen oder 澳门皇冠_皇冠足球比分-劲爆体育eren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen“ (§ 44b Absatz 1 UrhG). Erfasst wird damit jede Analyse von urheberrechtlich geschützten Materials aller Werkkategorien des 

§ 2 Absatz 1 UrhG, wie insbesondere Texte, Bilder, Laufbilder und jede andere Form von Daten. § 60d UrhG ist auf Computerprogramme allerdings nicht anzuwenden (§ 69d Absatz 6 UrhG). Forscher:innen k?nnen sich insoweit aber auf die allgemeine Text und Data-Mining-Schranke in § 44b Absatz 2 UrhG berufen, soweit eine Rechteinhaber:in keinen Vorbehalt erkl?rt hat (§ 44b Absatz 3 UrhG). Die Schranke des Text und Data Mining gem?? § 60d UrhG erfasst auch alle Leistungsschutzrechte. In § 87c Absatz 1 Nr. 5 UrhG werden Vervielf?ltigungen eines nach Art und Umfang wesentlichen Teils einer Datenbank zu Zwecken des Text und Data Mining gem?? § 60d UrhG ausdrücklich zugelassen. 

2. Rechtm??ig zug?ngliche Werke

?ber den Verweis auf § 44b Absatz 2 Satz 1 UrhG sind Vervielf?ltigungen aber nur ?von rechtm??ig zug?nglichen Werken für das Text und Data Mining“ zul?ssig. Ein Werk ist rechtm??ig zug?nglich, wenn die Nutzer:in es ohne Rechtsversto? abrufen kann. Es kommt nach dem Wortlaut nicht darauf an, ob das Werk auch rechtm??ig (?ffentlich) zug?nglich gemacht wurde. Rechtm??iger Zugang besteht zu urheberrechtlich geschützten Werke, die von einer vertraglichen Vereinbarung zwischen der Rechteinhaber:in und Nutzer:innen erfasst werden, im Wege des Open Access frei zug?nglich gemacht werden oder die frei im Internet zug?nglich sind.

3. Nutzungsvorbehalt

W?hrend im Rahmen des § 60d UrhG ein m?glicher Vorbehalt der Rechteinhaber:in umbeachtlich ist, bietet die Schranke des § 44b Absatz 3 UrhG au?erhalb der wissenschaftlichen Forschung den Urheber:innen die M?glichkeit einen Nutzungsvorbehalt ihrer Werke für das Text und Data Mining zu erkl?ren (sogenannter ?Opt-out“). In diesem Fall greift die Schrankenbestimmung nicht. Ein Nutzungsvorbehalt bei online zug?nglichen Werken ist nach § 44b Absatz 3 Satz 2 UrhG nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.Beispielsweise kann er in das Impressum einer Internetseite integriert werden. Ob ein Nutzungsvorbehalt auch in ?natürlicher Sprache“ auf einer Internetseite als maschinenlesbar gelten kann, ist bislang ebenfalls umstritten. Das Landgericht  Hamburg verwies in einem Urteil vom 27. September 2024 (Az. 310 O 227/23) darauf, dass Vorbehalte in natürlicher Sprache m?glicherweise maschinenlesbar seien, wenn moderne KI-Technologien sie inhaltlich erfassen k?nnten. Ob sich diese Auffassung durchsetzen wird, bleibt abzuwarten.

4. L?schung

Trainingsdaten sind nach dem Training der KI zu l?schen. Die Datenbank von Trainingsdaten (?Korpus“) müsste daher nach Abschluss des konkreten KI-Projekts vernichtet werden. Eine langfristige Speicherung der Trainingsdaten, etwa um damit weitere KI-Systeme zu trainieren, w?re damit gem?? § 44b Absatz 2 Satz 2 UrhG unzul?ssig. Sofern der Bestand an  Trainingsdaten  erhalten werden soll, w?re der Abschluss einer Lizenzvereinbarung mit den Rechteinhaber:innen notwendig.  

Erfolgt das Text und Data Mining aber zu wissenschaftlichen Zwecken, ist die gro?zügigere Schrank des § 60d Absatz 5 UrhG einschl?gig, wonach Vervielf?ltigungen so lange aufbewahrt werden dürfen, wie es für Zwecke der wissenschaftlichen Forschung oder zur ?berprüfung wissenschaftlicher Erkenntnis erforderlich ist. Als ?zur ?berprüfung erforderlich“ wird man nach den Anforderungen der guten wissenschaftlichen Praxis in den meisten F?llen einen Zeitraum von zehn Jahren annehmen k?nnen. Die Forscher:innen sind dabei aber verpflichtet, angemessene Sicherheitsvorkehrungen gegen unbefugte Benutzung zu veranlassen, wie beispielsweise in Forschungsdatenrepositorien, die gew?hrleisten k?nnen, dass notwendigen Sicherheitsma?nahmen befolgt werden.

II. Vorübergehende Vervielf?ltigungshandlungen

Nach der Schrankenbestimmung des § 44a UrhG sind vorübergehende Vervielf?ltigungshandlungen, die flüchtig oder begleitend sind und einen integralen und wesentlichen Bestandteil eines technischen Verfahrens darstellen zur Erm?glichung einer ?bertragung eines Werkes oder sonstigen Schutzgegenstandes zul?ssig. Dies gilt aber nur dann, soweit die Vervielf?ltigungshandlungen keine eigenst?ndige wirtschaftliche Bedeutung haben. 

Auf diese Schrankenbestimmung kann das Training eines KI-Systems somit nur dann gestützt werden, wenn das KI-System nicht aufgrund einer dauerhaften Kopie lernt, sondern die KI an einem im Arbeitsspeicher gespeicherten Werk lernt, das anschlie?end wieder gel?scht wird. Die Schrankenbestimmung k?me auch nur dann zur Anwendung, wenn die vorübergehenden, tempor?ren Vervielf?ltigungshandlungen keine eigenst?ndige wirtschaftliche Bedeutung h?tten und damit keine neue eigenst?ndig verwertbare Nutzungsm?glichkeit er?ffnet würde. ?berwiegend wird  aber gerade vertreten, dass Vervielf?ltigungshandlungen zum KI-Training eine eigenst?ndige Nutzungshandlung sind, der eine eigene wirtschaftliche Bedeutung zugeschrieben wird. 

Die Schrankenbestimmung des § 44 a UrhG w?re damit nicht auf die Verwertung von urheberrechtlich geschützten Inhalten zum Training eines KI-Systems anzuwenden.