ChatGPT und das Urheberrecht

So nutzen Sie generative AI/KI rechtssicher

05.06.2023 von Jörg-Alexander Paul und Oliver Belitz

KI wird in immer mehr Bereichen eingesetzt. Doch wie können Unternehmen ChatGPT und Co. nutzen, ohne Urheberrechtsverletzungen zu riskieren?

Wer ChatGPT und Co. ohne Angst vor Urheberrechtsverletzungen und Copyright-Klagen nutzen will, sollte vier Fragenkomplexe beachten.
Foto: TSViPhoto - shutterstock.com

Texte erfassen, Bilder erstellen, Programmcode schreiben - generative KI, die eigene Inhalte erschafft, wird immer mehr genutzt. Doch viele Unternehmen stehen vor der Frage, wie sie ChatGPT und Co. nutzen können, ohne Urheberechtsverletzungen und Copyright-Klagen zu riskieren.

Mit Blick auf das Urheberrecht kristallisieren sich vier Fragenkomplexe heraus:

Wem "gehört" der Output, den eine KI wie ChatGPT generiert?
Wie ist der KI-Betreiber beim Training der KI geschützt?
Besteht die Gefahr, dass die Nutzung des Outputs einer KI das Urheberrecht von Werken im Lernmaterial verletzt?
Sind KI-Tools überhaupt urheberrechtskonform verwendbar?

Wem "gehört" der Output, den eine KI wie ChatGPT generiert?

Lassen Unternehmen ChatGPT oder vergleichbare KI-Tools-Inhalte generieren - beispielsweise einen Text, ein Bild oder Programmcode -, entsteht an diesem Output in der Regel kein Urheberrecht; weder zugunsten des Nutzers noch zugunsten des Betreibers der KI (im Falle von ChatGPT etwa OpenAI).

Urheber an einem Werk kann nur ein Mensch sein, eine KI erstellt im Sinne des Urheberrechts kein Werk.
Foto: metamorworks - shutterstock.com

Denn das Urheberrecht setzt einen Menschen als Urheber eines Werkes voraus - das sogenannte Schöpferprinzip. Damit ist der Output der KI im Sinne des Urheberrechts kein Werk. Lapidar gesprochen gehört der Output niemandem.

Prompt als schöpferische Leistung?

Dies ist nur dann anders zu bewerten, wenn die Eingabe des Prompts, also der Befehl des Nutzers an die KI, bereits als persönliche geistige Schöpfung zu werten ist. Der KI kommt dann bei der Erstellung des Outputs nur noch eine nebengeordnete Rolle zu.

In einem solchen Fall wäre die KI eher ein Werkzeug, das Vorgaben ausführt, statt selbständig eine schöpferische Aufgabe auszuführen. Um diese Ausnahme auszulösen, muss der Prompt des Nutzers äußerst detailliert sein.

Ein Beispiel hierfür wäre: Der Nutzer stellt ChatGPT einen eigenen Text zur Verfügung und erteilt ihm die Aufgabe, den Text sprachlich zu verbessern.

Nicht urheberrechtlich relevant wäre dagegen der Prompt "Schreibe mir eine Zusammenfassung u¨ber die Entwicklungen im Bereich Quanten-Computing in den letzten 12 Monaten", der einen umfangreichen, von ChatGPT verfassten Text, als Output hervorbringt.

Rolle der Vertragsregeln

Auch Vertragsregeln ändern an den Grundsätzen des Urheberrechts nichts.
Foto: Beautrium - shutterstock.com

Daran ändern auch vertragliche Regeln - sprich die Nutzungsbedingungen des KI-Betreibers - nichts. Ein Vertrag kann nur das Verhältnis zwischen den Vertragsparteien regeln, aber keine generelle Zuordnung erzeugen, wenn der Vertragsgegenstand nicht geschützt ist.

Das Einräumen eines Nutzungsrechts an dem Output wirkt deshalb nur zwischen den Parteien, und zwar dahin, dass derjenige, der das Nutzungsrecht einräumt, dem Vertragspartner verspricht, die Nutzung des Outputs zu unterlassen. Er dürfte dann den Output weder selbst nutzen, noch Dritten die Nutzung ermöglichen.

Dritten könnte weder derjenige, der das "Nutzungsrecht" einräumt noch der Vertragspartner die Nutzung des Outputs untersagen. Der Vertragspartner könnte lediglich von demjenigen, der das "Nutzungsrecht" eingeräumt hat, Unterlassung und gegebenenfalls Schadenersatz verlangen.

Wie ist der KI-Betreiber beim Training geschützt?

Die deutsche Gesetzgebung sieht vor, dass im Internet frei zugängliches Material zum Anlernen einer KI genutzt werden darf - das Data-Mining-Privileg. Es sei denn, der Urheber hat dem in maschinenlesbarer Form widersprochen.

Die Rolle des rechtlichen Prinzips

Um Rechtsverletzungen zu vermeiden, müssen die Betreiber von solchen KIs den Anlernprozess so gestalten, dass die KI diese Hinweise der Rechtsinhaber im Internet beachtet. Der Betreiber muss in jedem Fall auch sicherstellen, dass die von ihm zum Zwecke des Anlernens vervielfältigten Materialien nach der Anlernphase wieder gelöscht werden.

Besonders wichtig in diesem Zusammenhang: Da nur eine Analyse gestattet ist, muss die KI auch so programmiert sein, dass sie die Ausgangsmaterialien nicht, oder jedenfalls nicht unverändert, in ihre Ergebnisse integriert. Dies ist nur möglich, wenn die betroffenen Rechtsinhaber hierzu ausdrücklich zustimmen.

Kann KI-Output das Urheberrecht von Werken im Lernmaterial verletzen?

Noch fehlen europaweit einheitliche Regeln zum Umgang mit KI.
Foto: Ascannio - shutterstock.com

Auch bei den Nutzern kann es zu Urheberrechtsverletzungen kommen, wenn sie Output, der urheberrechtsverletzende Inhalte enthält, ihrerseits vervielfältigen und weiterverwenden. Das wäre beispielsweise dann der Fall, wenn sie die Ergebnisse in einem von ihnen kontrollierten Speicher ablegen.

Bei der rein privaten Verwendung des Materials können die Nutzer sich zwar auf das Recht zur Privatkopie berufen. Das ist jedoch nur dann möglich, wenn das kopierte Werk nicht offensichtlich rechtswidrig vervielfältigt oder öffentlich zugänglich gemacht wurde.

Urheberrecht versus Privatkopie

Für die Offensichtlichkeit ist es dabei entscheidend, ob ein objektiver Beobachter die Rechtswidrigkeit erkennen kann. Das Recht zur Privatkopie besteht nicht für alle urheberrechtlich geschützten Materialien. Für den Code eines Computerprogramms, aber auch für Datenbanken giltdas Recht auf Privatkopie nicht.

Entscheidend ist: Bei der Benutzung eines urheberrechtlich geschützten Werkes liegt immer dann keine Urheberrechtsverletzung vor, wenn die KI das Ausgangswerk so verändert, dass das ursprüngliche Material nicht mehr wiederzuerkennen ist.

So verletzt KI Urheberrechte

Oder anders formuliert: Je stärker der Output dem urheberrechtlich geschützten Material ähnelt, desto wahrscheinlicher ist eine Urheberrechtsverletzung. Zwei Beispiele verdeutlichen den Unterschied:

Zwei Beispiele

Führt der Prompt des Nutzers zu einer reinen Reproduktion (etwa die Ausgabe eines Songtextes) oder direkten Übersetzung eines Textes durch ChatGPT, dann setzt sich in diesem Fall der urheberrechtliche Schutz des Ausgangsmaterials am Output fort.

Eine Urheberrechtsverletzung liegt vor, wenn der Output auf eine Art und Weise genutzt wird, die der Urheber für das Ausgangsmaterial nicht gestattet hat und für die keine Schranke des Urheberrechts wirkt.

Der Unterschied zählt

Ähnelt ein von der KI generiertes Werk - etwa ein Bild - zu sehr dem Ausgangsmaterials, dann stellt dies eine Urheberrechtsverletzung dar.
Foto: DALL-E2

Anders sieht es bei der Erstellung von Sachtexten aus, wie etwa dem oben erwähnten Prompt zum Quanten-Computing. Der Output von ChatGPT hebt sich hier in der Regel deutlich von den Texten ab, mit denen die KI angelernt wurde.

Durch eigene Formulierungen, neue Sinnzusammenhänge, Vermengungen und/oder andere Schwerpunktsetzung erstellt ChatGPT, ähnlich wie bei einem menschlich generierten Fachartikel, einen neuen Text als Output, der nur selten eine Urheberrechtsverletzung auslösen wird.

Gefahr von Grauzonen

Allerdings gibt es neben diesen eindeutigen Fällen eine breite Grauzone. Inwieweit beim Output das Ausgangsmaterial wiedererkennbar ist, lässt sich oft nur durch eine Einzelfallbetrachtung eindeutig klären.

Sind KI-Tools urheberrechtskonform verwendbar?

Viele Unternehmen stellen sich die Frage, ob eine Verwendung von KI-Tools wie ChatGPT mit Blick auf das Urheberrecht überhaupt möglich ist? Zumal, wenn die KI mit Daten trainiert wird, deren Herkunft die Nutzer nicht kennen. Die Antwort darauf lautet klar "ja".

Allerdings sollten sich die Nutzer in jedem Falle vom Betreiber der KI zusichern lassen, dass dieser beim Anlernen das Urheberrecht - und insbesondere Sperrvermerke - beachtet hat. Das hindert einen Rechteinhaber zwar nicht, gegen den Nutzer vorzugehen, wenn der Anbieter sein Versprechen nicht eingehalten hat.

Risikoabschätzung

Die Art des KI-Prompts entscheidet mit darüber, ob der Output urheberrechtlich geschützt ist.
Foto: cgstock - shutterstock.com

Je nach Art des Prompts sollte sich das Risiko jedoch zumindest abschätzen lassen. In der Zukunft wäre zudem eine KI-Lösung denkbar, die einen KI-generierten Output vor dem weiteren (kommerziellen) Einsatz auf Identität oder große Ähnlichkeit zu urheberechtlich geschützten Werken prüft.

Trainieren Unternehmen ihre eigene KI-Lösung mit Daten, gibt es noch weitere Punkte zu berücksichtigen, um spätere Probleme zu vermeiden. Das anlernende Unternehmen muss insbesondere darauf achten, dass das Anlernmaterial keine urheberrechtlich geschützten Werke enthält, bei denen der Urheber die Verwertung nicht gestattet hat.

Nutzung von Online-Material

Bei online vorhandenem Material kann sich ein Unternehmen darauf verlassen, dass es alle zugänglichen Materialien für die Auswertung benutzen kann, bei denen keine Sperrvermerke angebracht sind. Es muss allerdings das von ihm genutzte Material ernsthaft auf solche Sperrvermerke prüfen.

Zu beachten ist jedoch immer, dass das benutzte Material nach Abschluss der Anlernphase wieder gelöscht werden muss. Dies gilt nicht nur für Textgeneratoren, sondern auch für bildgenerierende KIs wie Midjourney, Stable Diffusion oder Dall-E.

Weitere Rechtsaspekte

Für eine rechtssichere Nutzung von KI ist die Konformität mit dem Urheberrecht jedoch nicht allein ausschlaggebend. Auch die mögliche Verletzung von Persönlichkeitsrechten oder des Datenschutzrechts sind wichtige Themen, die von Unternehmen beachtet werden müssen.