LG München I: Urheberrechtsverletzung durch KI-Sprachmodelle – GEMA obsiegt in erster Instanz gegen OpenAI

Die Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte (GEMA) hat gemäß einer Presserklärung des Landgerichts München vor dem Landgericht München I in erster Instanz gegen zwei Unternehmen der Unternehmensgruppe Open AI gewonnen und ein Urteil auf Unterlassung, Auskunftserteilung und Schadensersatz wegen der Verletzung von Urheberrechten an Songtexten erwirkt (Landgericht München I, Urteil vom 11. November 2025, Az. 42 O 14139/24). Das Gericht hat also auf eine Haftung von OpenAI/ChatGPT wegen der Verletzung von Urheberrechten erkannt. Das Urteil ist nicht rechtskräftig.

Edit 12.11.2025: Die Urteilsbegründung ist nun hier im Volltext abrufbar.

Hintergrund des Rechtsstreits

Die GEMA ist eine weltweit agierende Autorengesellschaft (Verwertungsgesellschaft) für Werke der Musik. Sie verwaltet in Deutschland die Nutzungsrechte aus dem Urheberrecht von über 90.000 Mitgliedern (Komponisten, Textdichtern und Musikverlegern) sowie von fast zwei Millionen Rechteinhabern aus aller Welt

Liedtexte mit einer ausreichenden Individualität genießen urheberrechtlichen Schutz als Sprachwerke im Sinne von § 2 Abs. 1 Nr. 1 UrhG.

Mit dem Klageverfahren hat die GEMA Ansprüche auf Unterlassung, Auskunft und Schadensersatz wegen Eingriffen in die urheberrechtlichen Verwertungsrechte von neun bekannten deutschen Urheberinnen und Urhebern (darunter „Atemlos durch die Nacht“ von Kristina Bach oder „Wie schön, dass du geboren bist“ von Rolf Zuckowski) geltend gemacht. Sie warf den beklagten Gesellschaften vor, dass in den Versionen 4 und 4o des beliebten Sprachmodells ChatGPT die betroffenen Liedtexte gespeichert („memorisiert“) und auf Nutzeranfragen teilweise wortgleich wiedergegeben würden.

OpenAI hatte sich damit verteidigt, dass ihre Modelle keine konkreten Trainingsdaten speichern, sondern nur statistische Wahrscheinlichkeiten abbilden würden. Etwaige Ausgaben (Outputs) seien das Ergebnis eigenständiger Nutzereingaben (Prompts), nicht aber eine direkte Wiedergabe gespeicherter Werke. Außerdem berief sich OpenAI auf die urheberrechtlichen Schranken für Text- und Data-Mining (§ 44b UrhG) und der erlaubten Vervielfältigung und Veröffentlichung als bloßes „unwesentliches Beiwerk“ (§ 57 UrhG).

Das Urteil: Vervielfältigung und öffentliche Wiedergabe durch Memorisierung

Das Gericht folgte dieser Argumentation von OpenAI nicht und erkannte auf eine Haftung wegen der Verletzung von Urheberrechten. Es stellte fest, dass die Liedtexte in den Sprachmodellen 4 und 4o reproduzierbar enthalten sind. Das Modell habe die Texte nicht bloß „erlernt“, sondern tatsächlich vollständig als Datenbestandteile übernommen – ein Vorgang, der als Vervielfältigung im Sinne von § 16 UrhG zu werten sei. Hierbei berief sich das Gericht auf die informationstechnische Forschung, aus der bekannt sei, dass Trainingsdaten in Sprachmodellen enthalten sein können und sich als Outputs extrahieren lassen. Dies werde als Memorisierung bezeichnet. Bei memorisierten Inhalten befinde sich nach dem Training in den Parametern des Sprachmodells eine vollständige Übernahme dieser Inhalte. Dies sei bezüglich den klaggegenständlichen Liedtexten nach der Würdigung des Gerichts durch einen Abgleich der Liedtexte, die in den Trainingsdaten enthalten waren, mit den Wiedergaben in den Outputs festgestellt. Ein bloßer Zufall könne angesichts der Komplexität und Länge der Liedtexte als Ursache für die Wiedergabe der Liedtexte im Output ausgeschlossen werden. Die Liedtexte seien damit verkörpert iSv. § 16 UrhG, nämlich reproduzierbar in den Modellen festgelegt. Bei der Auslegung des Begriffs der Vervielfältigung bezog sich das Gericht auch auf Art. 2 der Richtlinie 2001/29/EG („InfoSoc-Richtlinie“), nach dem eine Vervielfältigung „auf jede Art und Weise und in jeder Form“ vorliege.

Die Wiedergabe der Liedtexte in Chatbot-Antworten stelle eine öffentliche Zugänglichmachung in Sinne von § 19a UrhG dar.

Betreiber des Sprachmodells ist verantwortlich

Sowohl für die Vervielfältigung als auch die öffentliche Wiedergabe sind nach Ansicht des Gerichts die Betreiber der Sprachmodelle verantwortlich – nicht der einzelne Nutzer. Die Betreiber der Sprachmodelle hätten die Liedtexte als Trainingsdaten ausgewählt und seien daher für die Architektur der Modelle, die Memorisierung der Trainingsdaten und damit auch für den ausgegebenen Output verantwortlich.

Urheberrechtliche Schrankenbestimmungen greifen nicht

Eine Privilegierung des Sprachmodells durch urheberrechtliche Schrankenbestimmungen lehnte das Gericht ab:

Zwar könnten Sprachmodelle grundsätzlich dem Anwendungsbereich der Schrankenbestimmung für Text- und Data-Mining nach § 44b UrhG unterfallen. Diese erstrecke sich aber nur auf das Text und Data Mining vorbereitende Handlungen ohne Verwertungsinteresse, zum Beispiel erforderliche Vervielfältigungen beim Zusammenstellen des Datensatzes für das Training, etwa zur Überführung in ein anderes (digitales) Format oder vorübergehende Speicherungen im Arbeitsspeicher. Vorliegend würden jedoch nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt und dauerhaft im Sprachmodell verkörpert, wodurch in das Verwertungsrecht der Rechteinhaber eingegriffen werde. In diesem wesentlichen Aspekt unterscheidet sich der Fall praktisch auch von dem Sachverhalt, über den das Landgericht Hamburg kürzlich im Laion-Urteil zu entscheiden hatte (Landgericht Hamburg, Urteil vom 27.09.2025, 310 O 227/23). In diesem Fall ging es um die Zusammenstellung von Trainingsdatensätzen, die für das Training von KI-Modellen genutzt werden können. Die Datensätze enthalten Linklisten samt dazugehörigen Daten, beispielsweise ein Link zu einem Bild im Internet nebst einer Bildbeschreibung und Auskunft in Textform, was auf dem Bild zu sehen ist. Anders im vorliegenden Fall eines Sprachmodells ist das Bild selbst im Datensatz jedoch nicht enthalten, sondern wird bei der Erstellung des Datensatzes lediglich vorübergehend zu Kontroll- und Analysezwecken vervielfältigt und danach wieder gelöscht.

Das Landgericht München hat auch eine analoge Anwendung der Schrankenbestimmung für Text- und Data-Mining nach § 44b UrhG abgelehnt. Insoweit mangele es an einer vergleichbaren Interessenlage, weil die Werkverwertung durch die Urheber und Rechteinhaber bei Vervielfältigungen im Sprachmodell nachhaltig beeinträchtigt werde. Sie würden durch eine analoge Anwendung der Schrankenbestimmung, die keine Vergütung vorsehe, schutzlos gestellt.

Bei dem gesamten Trainingsdatensatz handelt es sich nach der Ansicht des Gerichts nicht um ein urheberrechtlich geschütztes Werk. Daher seien die Vervielfältigungen der streitgegenständlichen Liedtexte auch nicht als „unzulässiges Beiwerk“ nach § 57 UrhG privilegiert.

Keine Einwilligung in Nutzung zum Training von KI-Sprachmodellen

Schließlich sei der Eingriff in die Verwertungsrechte auch nicht durch eine Einwilligung der Rechteinhaber gerechtfertigt. Eine solche könnte grundsätzlich durch die Veröffentlichung der Liedtexte im Internet mit der Erlaubnis oder Billigung des Rechteinhabers in Betracht kommen – so stimmt etwa der Inhaber einer Website einer Indexierung der veröffentlichten Inhalte durch Crawler von Suchmaschinen konkludent zu, wenn er dies nicht technisch unterbindet. Das Training von Modellen ist nach Ansicht des Gerichts aber nicht als eine übliche und erwartbare Nutzungsart zu werten, mit der der Rechteinhaber rechnen muss.

Bedeutung der Entscheidung, Haftung für Urheberechtsverletzung

Das Urteil ist noch nicht rechtskräftig, dürfte aber Signalwirkung für die weitere Rechtswicklung haben. Erstmals bejaht ein deutsches Gericht eine urheberrechtlich relevante Vervielfältigung eines Werks durch dessen Reproduktion im Output eines KI-Sprachmodells. Es handelt sich mithin um das erste Urteil, durch das eine Haftung eines KI-Anbieters wegen einer Verletzung von Urheberrechten anerkannt wurde. OpenAI haftet also selbst für die Wiedergabe der Liedtexte in ChatGPT. Das Landgericht München I hat die Verkörperung in sachlicher Hinsicht letztlich in Form eines Umkehrschlusses bejaht – wenn sich das Werk bereits mit einem einfach gehaltenen Prompt identisch reproduzieren lässt, muss es in der Parametrierung des KI-Sprachmodells auch enthalten und damit im Rechtssinne verkörpert sein. Diese Argumentation ist schlüssig und wird für OpenAI oder andere betroffene Anbieter von generativen KI-Systemen im Rahmen der prozessualen Darlegungslast nur schwer zu widerlegen sein. In rechtlicher Hinsicht wird die Frage, ob dies eine „Verkörperung“ iSv. § 16 UhrG darstellt, letztlich vom Bundesgerichtshof, bzw. – weil der Begriff der Verkörperung durch die Richtlinie 2001/29/EG („InfoSoc-Richtlinie“) unionsrechtlich harmonisiert ist – vom Europäischen Gerichtshof entschieden werden müssen.

Für Künstler, die Kreativwirtschaft und Verwertungsgesellschaften bedeutet das Urteil Rückenwind: Die wirtschaftliche Nutzung urheberrechtlich geschützter Inhalte durch KI könnte künftig vergütungspflichtig werden.

Für Anbieter von generativen KI-Systemen verschärft sich die Haftungsfrage, insbesondere im Hinblick auf Trainingsdaten, die urheberrechtlich geschützt sind und für die der Anbieter keine Nutzungsrechte besitzt.

Praxistipps für Nutzer generativer KI

Bewusst mit urheberrechtlich geschützten Inhalten umgehen: Vermeiden Sie es, geschützte Materialien wie Texte, Lieder oder Bilder, für die Sie keinen Nutzungsrechte besitzen, als Prompt-Eingaben zu verwenden oder KI-Reproduktionen solcher Materialien zu verwenden. Auch die Nutzung scheinbar „frei verfügbarer“ KI-Outputs kann problematisch sein, wenn diese urheberrechtlich geschütztes Material enthalten.
Transparenz wahren und Vertragsmodelle prüfen: Agenturen und Unternehmen sollten dokumentieren, welche Tools und Modelle sie nutzen – und deren Nutzungsbedingungen prüfen. Nicht jedes KI-System bietet rechtssichere Lizenzen und Haftungsfreistellungen oder zumindest Gewährleistungs- und Rückgriffsrechte.
KI-Kennzeichnung wird Pflicht: Ab dem 2. August 2026 tritt in der EU die Kennzeichnungspflicht nach 50 KI-VO für bestimmte KI-generierte Inhalte in Kraft. Inhalte, die mit KI erstellt und als echt wahrgenommen werden könnten (wie Texte, Bilder, Videos und Audio), müssen dann gekennzeichnet werden, sofern keine menschliche Bearbeitung stattgefunden hat, die das Werk maßgeblich prägt. Ausnahmen gelten für rein interne Nutzung oder bei künstlerischen Werken, bei denen die KI nur unterstützend eingesetzt wird.
Eigene Inhalte absichern: Künstler, Kreativschaffende und Agenturen sollten ihre eigenen Werke soweit möglich rechtlich (bspw. durch eine beweisfähige Dokumentation der Werkschöpfung und begleitenden Schutz über Marken– und Designrechte) und technisch (bspw. über digitale Wasserzeichen, Registrierung oder Wahrnehmungsverträge mit Verwertungsgesellschaften) absichern.
Vertragliche Regelungen treffen: Agenturen und Auftraggeber und Kreativschaffende sollten vertraglich klären, wer für etwaige Rechtsverletzungen haftet, wenn KI-generierte Inhalte verwendet werden.
Entwicklung beobachten: Da das Urteil noch nicht rechtskräftig ist, bleibt abzuwarten, ob höhere Instanzen oder der EuGH die Linie bestätigen. KI-Anbieter werden sich künftig stärker mit Lizenzmodellen und urheberrechtlicher Compliance befassen müssen.

Haben Sie Fragen? sprechen Sie uns an. Wir unterstützen gerne als spezialisierte Anwaltskanzlei rund um die Themen künstliche Intelligenz und KI-Recht.

Rechtsanwalt Tobias Spahn, BBS Rechtsanwälte Hamburg