Der rasante Fortschritt bildgebender KI-Systeme betrifft unsere Branche in eklatantem Ausmaß. In Sekunden können allein aufgrund kurzer Textbefehle Bildwelten in einer scheinbar unendlichen Bandbreite an Stilen, Sujets, Farben und Formen erstellt werden – die Präsenz von genKI-erzeugten Bildern in unseren digitalen wie analogen Lebensräumen nimmt täglich zu.
Als professionelle Bildschaffende müssen sich Illustrator:innen mit dieser neuen Konkurrenz, die mit Macht auf ihre Märkte dringt, auseinandersetzen.
Als Hilfe zur Einordnung, Orientierung und Aufklärung sammeln wir auf dieser Seite wichtige Informationen zum Thema und geben Auskunft über Haltung sowie politische Arbeit der IO.
Wichtige Fragen:
2023 haben wir unter unseren Mitgliedern eine Online-Befragung zur aktuellen Berufssituation durchgeführt. Darin geben 23 Prozent der Befragten an, dass die Einführung von KI-Bildgeneratoren bereits jetzt schon direkte Auswirkungen auf ihre illustrative Arbeit hat. Bei der Frage nach der größten Herausforderung der Zukunft lag die Antwort „Künstliche Intelligenz“ mit großem Abstand auf Platz 1.
Darüber hinaus häufen sich Berichte über ausbleibende Aufträge, veränderte
Anfragen und Preiseinbrüche. Viele Verlage und Agenturen setzen offenbar vermehrt auf KI-Bebilderung, was sich auch an entsprechenden Buchcovern, Magazinen und anderen Produkten zeigt. Teils fragen Kund:innen lediglich Bildskizzen für geringes Honorar an, die sie dann selbst mithilfe von KI fertigstellen oder liefern bereits fertige KI-generierte Abbildungen, die dann nur noch überarbeitet werden sollen.
Insgesamt stellen wir eine große Verunsicherung fest. Illustrator:innen aus alles Einsatzgebieten machen sich Sorgen über ihr finanzielles Auskommen, haben Zukunftsängste und denken über Jobalternativen nach.
Unter großem Druck stehen schon jetzt die Bereiche Concept-Art und Gaming. So berichten Mitarbeitende von Games-Studios von großen Kündigungswellen, bei denen Jobs gestrichen und auf KI verlegt werden. Hintergrund könnte dabei sein, dass KI-Systeme wie Midjourney einen starken Fokus auf Plattformen wie ArtStation (Showcase für Games, Filme, etc.) hatten und haben. Entsprechend gut ist in diesem Bereich die Trainingsdatenlage – und somit auch der Output der KI-Systeme.
Ähnliches gilt für die Visualisierung von Storyboards in der Werbung. Hier gibt es bei den Abbildungen trotz unterschiedlicher Produkte oft größere Ähnlichkeiten und Überschneidungen. KI-generierte Storyboards erfüllen daher offenbar schon jetzt deutlich häufiger die Kundenerwartungen als in anderen Bereichen.
Aktuell vergleichsweise wenig betroffen sind Bereiche wie Graphic Recording und Wissenschaftsillustration. Daran zeigt sich auch deutlich eine große Schwäche der aktuellen KI-Generation: Sie ist stark, wenn Bekanntes nur leicht modifiziert werden muss, versagt aber häufig noch bei der Umsetzung neuer Ideen – also etwa der Bebilderung neuer wissenschaftlicher Erkenntnisse.
Derzeit verbreitete Bildgeneratoren sind DALL·E, Stable Diffusion, Midjourney, Adobe Firefly und Flux.
Die Fülle an Anbietern und Systemen nimmt laufend zu; zudem verfeinern und spezialisieren sich die Modelle auf Bereiche wie z. B. die Generierung von fotografischen Abbildungen, Vektordaten, 3D-Modellen, Animationen etc.
Der Zugang zur Nutzung dieser Bildgeneratoren ist je nach Anwendungsumfang teils gratis, teils über Abonnement-Modelle möglich (zwischen ca. 7 $ und 120 $/Monat bei intensiver Nutzung).
Hervorzuheben ist das Modell Firefly: Adobe bewirbt sein KI-System mit der Aussage, für den Trainingsdatensatz ausschließlich lizenzfreies oder speziell lizenziertes Bildmaterial verwendet zu haben (diese Angaben sind jedoch umstritten und lassen sich aktuell nicht verifizieren). Das populäre und sehr weit verbreitete Sprachmodell ChatGPT, hinter dem OpenAI und Microsoft stehen, integrierte jüngst ebenfalls die Möglichkeit, Bilder generieren zu können – diese Funktion ist sogar im Gratis-Zugang verfügbar.
Grundbasis sind die Trainingsdaten, mit denen das KI-System „lernt“. So sammeln meist Bots („Webcrawler“) automatisiert Unmengen von Bildern im Internet und verschlagworten diese – entweder maschinell automatisiert oder bei komplexeren Bildern und Themen auch durch billige Arbeitskräfte in der dritten Welt.
Mit diesen Daten wird die KI dann „trainiert“. Stable Diffusion etwa nutzt dafür den öffentlich zugänglichen Datensatz LAION-5B. Erstellt wurde dieser Datensatz von der gemeinnützigen deutschen Organisation LAION mit Unterstützung des Unternehmens Stability AI. Stability AI hat dabei die Rechenpower zur Verfügung gestellt und den Datensatz so erst möglich gemacht.
In der Regel enthält der Trainingsdatensatz nicht die Bilder selbst, sondern ist lediglich ein Referenzverzeichnis, liefert also „nur“ eine Bildbeschreibung als Text und den Link zum Bild. Erst beim eigentlichen KI-Training wird dann tatsächlich auf das Bild zugegriffen, was für die urheberrechtliche Debatte von Bedeutung ist.
Nutzer:innen eines Bildgenerators geben dann über ein Textfeld ihren Bildwunsch ein („Tanzender Bär mit blauem Ball“). Durch das vorangegangene Training hat die KI gelernt, Text mit Bild in Zusammenhang zu bringen. Sie erzeugt dann eine visuelle Entsprechung des eingegebenen Textes – malt also eines oder mehrere Bilder, welche die Nutzer:innen dann mit weiteren Textbefehlen bearbeiten und verfeinern können. Auch können sie bestimmte Stilrichtungen und Referenzen vorgeben („in the style of Picasso“ oder „trending on ArtStation“).
Die Qualität ist in jüngster Zeit rasant gestiegen, hat aber Schwächen. Oft braucht es ein geübtes Auge – beispielsweise von uns Fachleuten – um die aktuell noch vorhandenen Schwachpunkte zu entdecken: Fehler in der menschlichen Anatomie, fraktale Elemente (etwa das Muster einer Hauswand, das sich in der Straße vor dem Haus fortsetzt) und andere mehr.
Auch neigen KI-Systeme jüngsten Studien zufolge (Marcus/Southen) zunehmend zum Kopieren und Plagiieren. Popkulturelle Phänomene wie etwa die Bildwelten aus dem Marvel-Universum oder die Simpsons werden auch ohne gezieltes Prompting öfter reproduziert, weil diese überproportional stark in den Trainingsdaten enthalten sind.
Unter dem Strich ist anzunehmen, dass Schwächen wie die Darstellung der Anatomie in den kommenden Jahren verschwinden werden. Gleichzeitig wird sich aber die Plagiatsdebatte verschärfen, weil die KI-generierten Bilder die ursprünglichen Trainingsdaten immer genauer wiedergeben können.
Nein.
Die Werke von Kreativschaffenden zeichnen sich aus durch Originalität, Authentizität, Intention ihrer Urheber:innen und durch deren persönliche Haltungen. Kreatives Schaffen ist ein Prozess des aktiven Reflektierens auf Grundlage des Verstehens. Illustrator:innen verfügen über eine in meist jahrelangem Studium und Praxis ausgebildete Bildkompetenz.
Illustration erfüllt kommunikative Zwecke – sie erzählt, erklärt, veranschaulicht. Das lässt sich mit willkürlichen Bildern per Knopfdruck nicht erfüllen. Dazu braucht man das Wissen, wie Bilder gestaltet sind, wie sie kommunizieren und zu uns sprechen. Eine KI kann aktuell nicht verstehen, warum die Bastelanleitung für Kinder anders aussehen muss, als eine Bauanleitung für Erwachsene, ebenso sind die meisten Laien nicht in der Lage, die Aussagekraft und „Funktion“ von Bildern umfänglich zu beurteilen. Diese Kompetenz liegt bei uns und kann in den kommenden Jahren höchstwahrscheinlich nicht durch KI ersetzt werden.
Generative KI kürzt Prozesse ab und ersetzt zum Teil auch handwerkliche Fähigkeiten – gerade deshalb ist es um so wichtiger, unsere Expertise, das bewusste Steuern des Prozesses des Bildschaffens, auszubauen und den Mehrwert dieser Leistungen gegenüber unseren Auftraggeber:innen zu kommunizieren.
Leider sind immer noch viele rechtliche Fragen offen. Hier daher ein unverbindlicher und zwangsläufig nicht rechtssicherer Überblick:
Urheberrechtsschutz
Unter Jurist:innen besteht weitgehende Einigkeit, dass ein KI-generiertes Werk keinen Urheber im rechtlichen Sinne hat und deshalb auch frei verwendet werden kann. Setzen Illustrator:innen für ihre Arbeit genKI-Systeme ein, steht der Werkcharakter – und damit der urheberrechtliche Schutz sowie die Einräumung von Nutzungsrechten – in Zweifel bzw. bleibt gänzlich ausgeschlossen. Verlage gehen scheinbar vermehrt dazu über, die Nutzung von genKI zur Erstellung von Illustrationen vertraglich weitgehend auszuschließen.
Trainingsdaten
GenKI-Systeme fußen auf riesigen Trainingsdatensets, zu deren Erstellung Hunderte Millionen von Bildwerken aus dem weltweiten Internet bezogen werden. Diese Nutzung erfolgt in der Regel ohne Kenntnis, ohne Einverständnis, ohne Kennzeichnung und ohne Kompensation der Urheber:innen.
(Über die Webseite https://haveibeentrained.com lässt sich prüfen, ob eigene Arbeiten in den vielgenutzten Datensatz „LAION B5“ eingegangen sind. Im Rahmen einer Befragung gaben 82 Prozent unserer Mitglieder an, dort mindestens ein eigenes Bild gefunden zu haben, das für KI-Training genutzt wurde.)
Wir bewerten diese Nutzung als massiven Bruch von Urheberrechten.
Ein Problem: Seit der Novellierung 2021 enthält das Urheberrechtsgesetz den § 44b, der das „Text- und Data Mining“ auch zu kommerziellen Zwecken unter bestimmten Vorgaben erlaubt.
Der Wortlaut des entsprechenden Paragraphen 44b UrhG:
(1) Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.
(2) Zulässig sind Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining. Die Vervielfältigungen sind zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind.
(3) Nutzungen nach Absatz 2 Satz 1 sind nur zulässig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zugänglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.
Aus unserer Sicht ist diese Regelung hochproblematisch. Die in Absatz 3 eingeräumte Möglichkeit des Vorbehalts verdreht das dem Urheberrecht zugrunde liegende Prinzip der Zustimmung von Urheber:innen ins Gegenteil und ist zudem in der Praxis völlig untauglich: Einerseits existiert kein anerkannter Standard, wo und in welcher Form dieser „Opt-out“ rechtlich bindend formuliert sein muss. Andererseits ist inzwischen belegt, dass existierende Opt-outs in großem Maßstab ignoriert werden und völlig wirkungslos bleiben. Die Intransparenz des Prozesses macht es zudem unmöglich, die Wirkung eines Opt-outs nachzuvollziehen.
Noch wichtiger: Die bisher erste und einzige wissenschaftliche Studie („Urheberrecht und Training generativer KI-Modelle – technologische und juristische Grundlagen“ Dornis & Stober) zum Thema kommt zu dem Schluss, dass die Nutzung von Werken zum KI-Training erheblich über die vom Gesetzgeber intendierte Definition der Mustererkennung durch Text- und Data Mining hinausgeht und eine eigene, neue Nutzungsform im Sinne des UrhG darstellt.
Plagiate & Bearbeitungen
Eine Studie von Gary Marcus und Reid Southen belegt die Tendenz von KI-Bildgeneratoren, marken- oder urheberrechtlich geschützte Bilder zu plagiieren. Gerade popkulturell weitbekannte Charaktere oder Sujets werden auch ohne gezieltes Prompting nahezu deckungsgleich zu Originalbildern ausgegeben. Es sind zahlreiche Klagen anhängig – zuletzt hat als prominentester Fall Disney zusammen mit Universal Klage gegen Midjourney eingereicht. In Deutschland erlangte der Carlsen Verlag mit einer Pressemitteilung zu den sogenannten „Conni-Memes“ Aufmerksamkeit.
Weitere Aspekte
Die durch genKI mögliche Generierung, Reproduktion und Imitation von Stilen, Stimmen, Gesichtern und Ähnlichem berührt Persönlichkeitsrechte in elementarer Weise und bedarf noch umfassender rechtlicher Auseinandersetzung.
Wir empfehlen allen Mitgliedern, auf ihren Websites einen Widerspruch zu platzieren, auch wenn dieser wegen offener rechtlicher Fragen noch keinen garantierten Schutz vor unerlaubter Nutzung darstellt. Dieser Text im Impressum könnte wie folgt aussehen:
„Gemäß §44b Absatz 3 UrhG widerspreche ich ausdrücklich jeglicher Verwendung der auf dieser Webseite eingestellten Inhalte zu Zwecken des Text- und Data-Minings, insbesondere zur Ermöglichung eines Einsatzes im Rahmen von Werken, die durch Künstliche Intelligenz (KI) geschaffen werden.“
Darüber hinaus raten wir allen Mitgliedern, sich regelmäßig über aktuelle Entwicklungen im KI-Bereich zu informieren und sich mit Kolleg:innen auszutauschen. Denn die Kreativbranche ist hier keineswegs wehrlos. So tauchen immer wieder Ideen und konkrete Lösungen auf, mit denen das uneingeschränkte Data-Mining der KI-Industrie gebremst oder gestört werden kann.
Ein Beispiel sind die Tools „Glaze“ und „Nightshade“, die von einem Team um Ben Zhao, Professor an der University of Chicago, entwickelt wurden. Bilder können mit der Software so bearbeitet werden, dass sie für die KI nicht mehr lesbar sind oder die KI regelrecht vergiften. Derartige Tools könnten künftig nicht nur eigene Werke schützen, sondern sind auch ein demonstrativer Akt des Widerstands, der die Industrie vielleicht zum Umdenken bewegt.
Unsere KI-Taskforce hat zusammen mit einer Reihe anderer Verbände aus der Kreativwirtschaft das Positionspapier „KI aber fair“ verfasst. Auf diese Weise bündeln wir die Kräfte der kreativen Bereiche Bild, Text und Musik. Darin fordern wir einen Dreiklang, den man unter den Schlagworten „Erlaubnis, Transparenz & Vergütung“ zusammenfassen kann.
1. Unsere Werke dürfen grundsätzlich nicht für das KI-Training verwendet werden, es sei denn, der Anbieter holt dafür aktiv eine Erlaubnis ein.
2. KI-Anbieter sind dazu verpflichtet, ihre Trainingsdatenquellen offenzulegen. Es muss nachvollziehbar sein, ob urheberrechtlich geschütztes Material verwendet wird und ob dafür eine Erlaubnis vorliegt. Zudem müssen KI-generierte Werke eindeutig als solche gekennzeichnet und leicht erkennbar sein. Ohne eine solche umfassende Transparenz dürfen Anbieter keine Marktzulassung erhalten.
3. Findet eine erlaubte Nutzung zu kommerziellen Zwecken statt, müssen die Urheber:innen an den Gewinnen beteiligt werden und eine angemessene Vergütung erhalten. Möglich ist hier etwa ein pauschale Lizensierung wie bei den gängigen Verwertungsgesellschaften.
Darüber hinaus engagiert sich die KI-Taskforce der IO auch in anderen Interessenverbänden wie der Initiative Urheberrecht (IU), der European Guild for AI Regulation (EGAIR) und dem Deutschen Designtag. Wir informieren unsere Mitglieder regelmäßig über aktuelle Entwicklungen und vertreten auch nach außen aktiv unsere Meinung – etwa auf den Podien der Leipziger und Frankfurter Buchmesse oder in Interviews mit dem ZDF und der Welt am Sonntag.
Ein erster Erfolg: Am 14. März 2024 hat das Europäische Parlament den Kompromiss zum weltweit ersten KI-Gesetz (AI Act) mit breiter Mehrheit angenommen. Der angenommene Verordnungstext zielt darauf ab, die Grundrechte, die Demokratie, die Rechtsstaatlichkeit und die ökologische Nachhaltigkeit vor risikoreicher KI zu schützen und gleichzeitig die Innovation zu fördern.
Ein Schritt in die richtige Richtung, dem weitere folgen müssen! Grundsätzlich positiv sehen wir die Aspekte zur Transparenzpflicht bei Trainingsdaten. Eine Forderung, welche die IO und weitere Verbände bereits im April 2023 im Positionspapier „KI aber Fair“ formuliert hatten. Negativ sehen wir, dass die Wahrung von Urheberrechten auch im AI Act einer Opt-Out Logik folgt – Urheber:innen stehen weiterhin vor der Aufgabe, der Nutzung ihrer Werke aktiv widersprechen zu müssen.
Kritisch beobachten werden wir die Umsetzung in nationales Recht sowie zukünftige Rechtsprechung zu Ausnahmeregelungen für kommerzielle und Open Source KI-Modelle. Hierzu empfehlen wir den Artikel der Kolleg:innen von EGAIR, die den Gesetzestext aus der Perspektive von Urheber:innen einordnen: https://www.egair.eu/the-ai-act-has-been-approved-by-the-coreper
Handlungsempfehlung für Illustrator:innen
Nach aktueller Urheberrechtslage ist das „Digitale Text und Datamining“ weitreichend erlaubt (§44b UrhG). Urheber:innen haben jedoch die Möglichkeit, einen „Maschinenlesbaren Widerspruch“ auf Ihrer Webseite zu formulieren. Auch wenn es derzeit keinen definierten Standard gibt, wo und in welcher Form dieser Widerspruch platziert sein soll, scheint derzeit ein Textbaustein auf der Webseite, z.B. im Disclaimer und/oder Impressum als Maßnahme sinnvoll, beispielsweise wie folgt:
„Gemäß §44b Absatz 3 UrhG widerspreche ich ausdrücklich jeglicher Verwendung der auf dieser Webseite eingestellten Inhalte zu Zwecken des Text- und Data-Minings, insbesondere zur Ermöglichung eines Einsatzes im Rahmen von Werken, die durch Künstliche Intelligenz (KI) geschaffen werden.“
Mit den Tools „Glaze“ und „Nightshade“ ist es möglich die Pixelstruktur von Bildern so zu manipulieren, dass sie für KI-Trainingszwecke nicht mehr verwendbar oder gar schädlich sind. Die Darstellung oder Bildqualität wird davon nur marginal beeinflusst.
Wer nicht möchte, dass die eigenen Werke von Auftraggeber:innen für das Training generativer KI genutzt werden, kann das in Verträgen über die Rechteeinräumung ausschliessen. Eine entsprechende Klausel könnte lauten:
„Gemäß §44b Absatz 3 UrhG widerspreche ich ausdrücklich jeglicher Verwendung meiner Werke zu Zwecken des Text- und Data-Minings, insbesondere zur Ermöglichung eines Einsatzes im Rahmen von Werken, die durch Künstliche Intelligenz (KI) geschaffen werden.“
Voraussetzung für die Verwendung von Illustrationen zu KI-Trainingszwecken ist die Einräumung umfangreicher Nutzungsrechte: exklusives Total Buyout (bis Faktor 5) und Bearbeitungsrecht (bis Faktor 10). Da die Einspeisung von Motiven in KI-Modelle mittelfristig zu einem Projektrückgang führen kann, sollte das Preisniveau konsequent hoch gehalten werden.
Werden für die Erstellung des eigenen Kreativwerks KI-basierte Generatoren verwendet, sollte der/die Auftraggeber:in im Vorfeld schriftlich darüber informiert werden.
Wer ausschließen möchte, dass die eigenen Illustrationen in Projekten eingesetzt werden, in denen außerdem KI-generierte Bildinhalte zum Tragen kommen, kann dies im Werkvertrag entsprechend festlegen.
Eine mögliche Formulierung lautet wie folgt:
“Die gelieferten Illustrationen dürfen nicht in Produkten verwendet werden, die auf dem Cover oder an anderer Stelle Illustrationen zeigen, die durch Künstliche Intelligenz erzeugt worden sind.”
Die KI-Taskforce der IO in Aktion
Zusammen mit drei Partnerverbänden waren wir einer der ersten Verbände, der zu einer verbindlichen Regulierung von KI in unserem Positionspapier “KI aber fair” geraten hat. Im Schulterschluss mit unserem Dachverband der Initiative Urheberrecht und der European Guild for AI Regulation (EGAIR) wirken wir auf nationaler und europäischer Ebene auf eine Regulierung hin.
Unsere Haltung tragen wir auf verschiedenen Podien nach außen. Bisher waren wir unter anderem bei Diskussionen auf der Leipziger Buchmesse, dem Festival of Animation, sowie der Frankfurter Buchmesse als auch beim deutschen Werbefilmpreis, dem Kurzfilmfestival Hamburg und dem Carlsen Creative Campus vertreten.
Beiträge aus Gesprächen mit unserer KI Taskforce finden sich bei ZDF Wiso und Welt am Sonntag. Ein Gespräch mit Jürgen Gawron, Vorsitzendem der IO, zum Thema “Wie Illustrator:innen um ihre Rechte kämpfen” gab es außerdem auf RBB Kultur zu hören.
Medien & ausgesuchte Links
2024
- Stellungnahmen und News des European Writers Council zum Thema KI und AI Act
- Reaktion von EGAIR (European Guild for Artificial Intelligence Regulation) auf die Verabschiedung des AI Act
2023
- Mitschnitt der Podiumsdiskussion auf der Frankfurter Buchmesse 2023 “Zukunft Buchillustration in Sichtweite” – Wie KI das Gesamtbild verändert
- ZDFwiso auf Instagram – “KI im Job” mit einem Statement von Tobias Wüstefeld, 3D-Illustrator, Mitglied der IO und KI-Taskforce
- Positionspapier der Initiative Urheberrecht zu künstlicher Intelligenz
- Offener Brief des Netzwerks Autorenrechte an die Bundesregierung im Zuge der AI Act Verhandlungen
- Interview mit IO-Vorstandsvorsitzendem Jürgen Gawron auf RBB Kultur “Wie Illustrator:innen um ihre Rechte kämpfen”
- Positionspapier KI-aber-fair – Webseite der Initiative
