Drei Personen sitzen an einem TIisch

adesso BLOG

KI beweist sich immer öfter bei der Lösung vor allem rationaler Aufgaben. Wie sieht es aber mit kreativen Aufgaben aus, die sich schwer quantifizieren lassen? Dieser Frage, dem Stand der Technik und dem Potential von KI im Kreativbereich gehe ich in diesem Blog-Beitrag nach.

Künstliche Intelligenz genoss in den letzten Jahren einen immer noch anhaltenden Aufschwung an Popularität. Es werden immer mehr neuartige KI-Technologien entwickelt und angewandt. Dennoch bewegt sie sich weiterhin primär im Umfeld von sehr rationalen und aufgaben- bzw. bereichsspezifischen Anwendungsfällen. Es wird oft gesagt, dass das, was uns als Mensch einzigartig macht, unsere Fähigkeit ist, große Kreationen in Kunst und Wissenschaft zu schaffen: kurz gesagt, unsere Kreativität. Dabei handelt es sich um eine Eigenschaft, für die man über bestehende Grenzen hinaus gehen muss, um etwas neuartiges zu schaffen, damit es als kreativ bezeichnet werden kann. Nun stellt sich die Frage, ob dies eine Eigenschaft ist, die sich auch eine KI aneignen kann, oder ob Kreativität eine Grenze einer KI darstellt, die uns Menschen vorbehalten ist. Sollte eine KI kreativ arbeiten können, stellt sich die Frage, was für Auswirkungen dies auf die Menschen haben könnte, die im Kreativsektor tätig sind und wie dort ein Zusammenspiel zwischen Mensch und KI aussehen könnte.

Was genau kann als kreativ bezeichnet werden?

Obwohl der Begriff der Kreativität im täglichen Leben verwendet wird, ist eine genaue Definition dieses Konzepts keine triviale Aufgabe. Der Begriff ist facettenreich und bietet Interpretationsspielraum. Das Cambridge-Wörterbuch definiert Creativity als:

“the ability to produce original and unusual ideas, or to make something new or imaginative”

Kreative Aufgaben erfordern im Allgemeinen ein gewisses Maß an originellem Denken, umfassender Erfahrung und Verständnis für das Umfeld. Eine bekannte Definition stammt aus einer umfassenden Literaturstudie von Sarkar und Chakrabarti (2008), in der sie über 200 dieser Definitionen analysierten und schlussendlich Kreativität zusammenfassend wie folgt definierten:

“Creativity occurs through a process by which an agent uses its ability to generate ideas, solutions or products that are novel and valuable.”

Der allgemeine Gedanke ist, dass es sich bei Kreativität um die Fähigkeit einiger menschlicher Individuen handelt, etwas zu schaffen, was es vorher nicht gab. Jedoch kann man bei näherer Betrachtung feststellen, dass diese Schöpfungen in den meisten Fällen von Konzepten abstammen, die es bereits gab, oder die es bereits hätte geben können, die aber noch niemand explizit zu einem festen Produkt verbunden hatte. Aus diesem Konzept einer neuen Verknüpfung von bestehenden Konzepten entstand Kunst wie Dalis “The Persistence of Memory”. Uhren wurden auch zuvor bereits gemalt und jeder kannte das Konzept des Schmelzens, aber niemand hat diese Konzepte zuvor verknüpft, wie Dali es tat. In der Historie gab es viele unterschiedliche Faktoren, die als Indikatoren für Kreativität genutzt wurden. Sarkar und Chakrabarti (2008) fassten diese in zwei Hauptkategorien zusammen: novelty (Ungewöhnlichkeit, Unerwartetheit, Überraschung) und value (Nützlichkeit, Qualität, Sinnhaftigkeit). Novelty wird für gewöhnlich als die definierende Eigenschaft eines kreativen Artefaktes genannt, aber der value ist ebenso nötig und wichtig. Es ist leicht, an etwas zu denken, das noch nie zuvor entworfen wurde, wie ein Auto mit fünfzehn Rädern. Während ein solches Auto zwar neuartig wäre, also durchaus eine hohe novelty hätte, fehlt es diesem kreativen Artefakt an value.

Wie weit ist die Technik?

Das wohl bekannteste Beispiel kreativer KI ist das Gemälde „Edmond de Belamy“, welches im Jahr 2018 für 432.500 Dollar versteigert wurde. Damit war es das erste von einer KI gezeichnete Gemälde, welches in einem Aktionshaus versteigert wurde. Die KI wurde dabei mit Portraits aus dem 14. bis 20. Jahrhundert trainiert, um daraufhin selbst eine Serie von elf Bildern mit Portraits der fiktiven Belamy-Familie zu schaffen.

Edmond de Belamy und ein Ausschnitt der Belamy-Familie

Samsung AI zeigte, dass es möglich ist, ein Porträt in Form eines Gemäldes, so wie die Mona Lisa, in ein Video zu transformieren, sodass das Gesicht des Portraits in einem gewünschten Stil sprechen kann. Sogenannte Deepfake-Technologien können realistisch aussehende, gefälschte Videos erstellen, indem sie einige Teile des Mediums durch synthetische Inhalte ersetzen. So konnte man bereits erfolgreich ein Video generieren in dem man eine Person wie Obama etwas beliebiges sagen lassen konnte, ohne dass auf dem ersten Blick klar ist, dass es sich um eine Fälschung handelt. Das Video kann hier gefunden werden.

Eine andere Form von KI innerhalb der Kunst sind Algorithmen, die neue Bilder auf Grundlage einiger weniger Eingabebilder generieren. Hierbei kann der Künstler eine Reihe von Bildern in den Algorithmus einspeisen, welcher dann versucht, diese zu imitieren und zu kombinieren. Die Webseite artbreeder stellt ein Beispiel für eine solche KI dar. Einen weiteren beeindruckenden Fortschritt für kreative KI im Bereich der Bildgenerierung machten OpenAI, als sie Januar 2022 DALL-E 2 veröffentlichten. Diese KI generiert nach eigener Aussage “realistic images and art from a description in natural language”. Hierbei kann man in einfacher menschlicher Sprache beschreiben, was man generieren möchte wie z.B. “An astronaut riding a horse as a pencil drawing”, und die KI schafft es, ein genaues Bild von der beschriebenen Idee in dem definierten Stil zu zeichnen.

Bild gemalt von DALL-E-2

Hierbei können völlig neuartige Bilder generiert werden, die es so vorher nicht gab. Es gibt bereits Ansätze, dies in Designprozessen zu integrieren. Zum Beispiel können beim Design eines neuen Schuhs bestimmte Kombinationsideen einfach in natürlicher Sprache ausgedrückt werden statt sie erst langwierig selbst skizzieren zu müssen. In folgener Abbildung ist dargestellt, wie eine Designbeschreibung in natürlicher Sprache aussehen könnte. Direkt bekommt man mehrere mögliche Designs des beschriebenen Stils angezeigt und kann seine Idee unmittelbar evaluieren, abändern oder weiterentwickeln. Dies kann langwierige Schritte beschleunigen, die sonst den kreativen Prozess eher aufhalten.

DALL-E-Nike.PNG

Eine weitere KI, die beeindruckende kreative Artefakte generiert, kann auf der Webseite this-person-does-not-exist beobachtet werden. Dort werden realistische Fotos von Personen generiert, die gar nicht existieren.

Google schaffte mit einer KI namens DeepDream Kunst, von der behauptet wird, dass sie gänzlich neue Konzepträume eröffnet. Sie generiert träumerische Kunst, die einen gänzlich eigenen und neuen Stil hat, der so von Menschen nicht erzeugt werden kann und bislang auch nicht erzeugt wurde. Der für die Kunst von DeepDream verantwortliche Alexander Reben beschreibt die Ergebnisse als einen kurzen Einblick in die Verschmelzung von Mensch und Technik, einen “cyberdelischen Drogentrip”.

Bild gemalt von DeepDream

Neben dem Bereich der Bildgenerierung konnte KI auch in anderen kreativen Bereichen Fortschritte verzeichnen. Beispielsweise wurde KI auch schon genutzt um Geschichten zu schreiben. So wurde das gesamte Skript eines Kurzfilms namens Sunspring von einer KI geschrieben. Im Jahr 2016 komponierte IBM Watson einen sechs Minuten langen Trailer für einen Horrorfilm namens Morgan. Teilweise können diese Skripte aber noch verwirrende Ergebnisse beinhalten. Eine Firma namens Botnik entwickelte eine KI, welche Texte von existierenden Büchern analysieren und daraufhin neue Kapitel schreiben kann. So hat das Team von Botnik alle Harry-Potter-Bücher in den Algorithmus gespeist und die KI hat unter anderem abstruse Sätze wie folgenden generiert:

“Ron was standing there and doing a kind of frenzied tap dance. He saw Harry and immediately began to eat Hermione’s family”

Im Bereich der musikalischen Kreativität wird häufig das Album “Hello World” genannt. Hierbei handelt es sich um ein ganzes Album, welches nur von einer KI komponiert wurde. Zuvor, im Jahr 2016, hatte das gleiche Team bereits einen Song im Stil der Beatles veröffentlicht. AIVA erlernte die Kunst der Musik durch das Lesen eines großen Datensatzes an Musik von den weltweit größten Komponisten wie Mozart, Beethoven oder Bach, wodurch sie ein eigenes Stück komponieren konnte, das teilweise auf ähnlichem Niveau überzeugen konnte. Es wurde auch ein Album von AIVAs Musik veröffentlicht, dessen Stücke bereits in Filmen und von Werbeagenturen verwendet werden.

Im Bereich des Journalismus ist KI bereits angekommen. Die Zeitschrift Forbes nutzt ein KI-basiertes Content-Management-System namens Bertie, das Reportern die ersten Entwürfe und Vorlagen für Nachrichten generiert.

Auch im Produktdesign wird KI bereits als Teil des kreativen Generationsprozesses eingesetzt. Es gibt Möbel, Fahrräder oder auch Drohnen, die von einer KI designed wurden. Airbus verwendete ein generatives KI-Design, um eine Trennwand für Flugkabinen zu gestalten und konnte damit die Effizienz bedeutend verbessern.

Die erwähnten Innovationen sind nur ein kleiner Ausschnitt der tatsächlichen Menge an Fortschritten, die in den letzten Jahren im Bereich der künstlichen Kreativität gemacht wurden. Die Tendenz an verbesserten Innovationen ist steigend.

Kann das tatsächlich auch kreativ genannt werden?

Betrachtet man die kreative KI als ein Medium, so werden die von diesem Medium produzierten Artefakte Teil der menschlichen Kultur, indem sie der Gesellschaft zur Wertschätzung ausgestellt werden. Demnach ist der Prozess zur Herstellung eines solchen KI-Systems, welches künstlerische Artefakte erzeugt, an sich bereits eine soziokulturell kreative und wertvolle Tätigkeit.

Um zu evaluieren, ob das erzeugte Medium eines KI-Systems an sich auch kreativ sein kann, muss das Potenzial und die tatsächliche Kreativität bereits produzierter künstlicher kreativer Artefakte bewertet werden. Die Frage nach der Bewertung von Kreativität ist eine der umstrittensten und kompliziertesten Herausforderungen in diesem Bereich. Es ist schwer, Kreativität auf quantitativer Weise zu messen. Um die wichtigsten Erkenntnisse der Wissenschaft kurz zusammenzufassen, kann gesagt werden, dass kreative KI-Systeme viele kreative Eigenschaften besitzen. Sie können neue, noch nicht dargewesene kreative Artefakte erzeugen, die sowohl neuartig als auch wertvoll sind und somit als kreativ bezeichnet werden können. Wo sie sich aber noch schwer tun ist z.B. bei sogenannter transformationaler Kreativität, also bei völlig neuartigen und den bisherigen Konzeptraum gänzlich verlassenen Ideen. Googles DeepDream wird als eine der wenigen KIs genannt, die bereits transformationale Kreativität zumindest teilweise beherrscht. Die Frage, ob diese Kunst auch das Kriterium value erfüllt, bleibt allerdings umstritten und benötigt in jedem Fall weiterhin eine menschliche Einschätzung. Die von KI erzeugten Variationen bewegen sich primär noch in einem begrenzten Rahmen. Dieser Rahmen wird durch die Wahl des Modells und des Datensatzes bestimmt und unterliegt einer inhärenten Einschränkung. Auch beherrscht KI noch nicht alle kreativen Eigenschaften, die wir Menschen in kreativen Prozessen nutzen, z.B. das Konzept der Abstraktion.

Was sind die Grenzen künstlicher Kreativität?

Kreative künstliche Intelligenzen kommen der menschlichen Kreativität teilweise sehr nah. Was sie jedoch fundamental vom Menschen unterscheidet sind die physischen Aspekte. Menschen erlernen nicht nur mentale, sondern auch physische Fähigkeiten, die sie zum kreativen Arbeiten nutzen. Eine KI, die Kunst kreiert, hat nie den Druck eines Pinsels gegen das Papier gefühlt und kann die Dynamik nicht so erfassen, wie das menschliche kognitive System es tut. Dies sind Erfahrungen, die die KI zum aktuellen Zeitpunkt nicht in den kreativen Prozess mit einbeziehen kann.

Außerdem ist zu erwähnen, dass KI zwar wertvolle Kunstwerke erzeugen kann, teilweise aber auch solche, die entweder nicht neuartig sind oder vom Menschen als sinnlos angesehen werden. Die Sinnhaftigkeit generierter künstlerischer Artefakte ist auch bei menschlich erzeugten Kunstwerken häufig ein strittiges Thema. So steht KI ebenso wie Menschen vor der Herausforderung, die Balance zwischen novelty und value zu finden. Diese stellt zum aktuellen Zeitpunkt für KI noch ein größeres Problem dar als für menschliche Künstler.

Graham Wallas unterteilte 1926 den kreativen Prozess in folgende Phasen: preparation (Informationsgewinnung), definition (Problemfindung), incubation (über Ideen nachdenken), illumination (Präsentation einer Lösung) und verification (Testen der Qualität einer Lösung). Die Fähigkeiten von KI beschränken sich aktuell auf die Prozessschritte preparation und incubation. Die restlichen Schritte benötigen weiterhin mindestens teilweise ein menschliches Eingreifen.

Aktuell basieren die effektivsten KI-Systeme noch auf überwachtem Lernen, bei dem es bereits Daten gibt, die der Wahrheit entsprechend durch Menschen beschriftet wurden. Der Lernprozess besteht dabei daraus, einen durchschnittlichen Fehler bzw. Verlust über die bekannten Beispiele zu berechnen und Anpassungen so zu treffen, dass dieser Verlust minimiert wird. Dabei werden ungewöhnlichen Beispielen (Ausreißern) häufig geringe Auswirkungen zugeschrieben, um eine Verzerrung des globalen Fehlers zu vermeiden. Konträr dazu steht allerdings das Ziel, im kreativen Prozess novelty zu generieren, wenn solch ungewöhnlichen Datenpunkten geringe Gewichtung zugeschrieben wird. Auch hier zeigt sich die Herausforderung einer KI, eine Balance zwischen novelty und value zu finden. Außerdem gibt es bei echten kreativen Prozessen normalerweise keine vordefinierten Ergebnisse, die so einfach eingestuft werden können. Auch wenn viele Werke aktuellen Trends folgen und auf Publikumsvorlieben beruhen, gibt es keine vollständig autonome, quantitative Möglichkeit, die Qualität eines kreativen Artefakts zu messen. Auch hier wird daher menschliches Eingreifen vorausgesetzt.

Eine weitere, zunächst offensichtlich erscheinende Beobachtung künstlicher Kreativität ist, dass sie kreative Artefakte aus einer rationalen, statt aus einer kreativen Absicht erzeugt. Es gibt Stimmen, die besagen, dass jegliche Kunstwerke ein Ausdruck menschlicher Erfahrungen sind und auch nur zu menschlichen Zwecken entstehen. Dies unterstreicht, warum es für eine KI so schwierig ist, Kunst auf dem menschlichen Niveau zu erzeugen.

Wie könnten kreative Prozess zukünftig aussehen?

Viele der angesprochenen Grenzen einer kreativen KI lassen sich auf die Frage danach zurückführen, wie eine Maschine selbstständig Kreativität messen bzw. evaluieren kann. Es konnte festgestellt werden, dass an vielen Stellen menschliches Eingreifen nötig ist. Da KI-Systeme von menschlichen Programmierern initialisiert werden und mit menschlich programmierten Algorithmen arbeiten, sind KI-Systeme immer mindestens zu einem geringen Teil abhängig vom Menschen. Es wäre falsch, Maschine und Mensch als unverbundene Konzepte zu betrachten, weswegen die Frage, ob Maschinen Kunst schaffen können, an sich bereits als irreführend angesehen werden kann. Es sollte eher nach der Rolle von KI im kreativen Prozess gefragt werden. Einerseits scheint eine ganze Reihe von Forschungsarbeiten dem Einsatz von KI als autarke Generatoren gewidmet zu sein, die versuchen, mit wenig Input des Benutzers ganze Kunstwerke zu erzeugen. Andererseits werden KI-Systeme auch als Kreativwerkzeuge betrachtet, die es uns ermöglichen, unsere eigene Kreativität zu steigern. In der Hinsicht wird KI mit einer Art weiterentwickeltem Pinsel für einen Maler verglichen. Jedoch, statt sich entweder auf die zurückhaltende Ansicht von KI als einfaches Werkzeug oder umgekehrt als gar eigenständiger Generator zu fokussieren, sollte vielmehr wahrgenommen werden, dass die wahre Kraft kreativer KI-Systeme aus der Partnerschaft mit dem Menschen entsteht. Kunst ist oft ein Ausdruck der individuellen Psyche, Emotion oder Erfahrung. Eine KI kann nicht dieselbe Lebenserfahrung sammeln oder die gleichen Emotionen haben, wie ein Mensch. In der Kombination einer Partnerschaft mit dem Menschen kann KI jedoch diejenigen des Künstlers wirkungsvoll zum Ausdruck bringen. Sie hat das Potenzial, noch viel mehr als ein einfaches Werkzeug zu sein, und könnte den Kreativsektor gänzlich revolutionieren. Mit KI hat man ein weiterentwickeltes Werkzeug welches erfolgreich eingesetzt werden kann, um dem Künstler Aufgaben abzunehmen, die zeitaufwendig sind. Es wurde bereits das Beispiel von DALL-E 2 genannt, in dem Designer weniger Zeit für das Skizzieren ihrer Ideen aufbringen müssen und mehr Zeit mit der Weiterentwicklung ihrer Gedankengänge verbringen können. Oder auch in den Arbeitsläufen der Postproduktion wird KI verstärkt zum Einsatz kommen, unter anderem in Form von verbesserten Tools für die Rauschunterdrückung, die Kolorierung, die Segmentierung, das Rendering und das Tracking.

Eine Umfrage von Adobe (2018) zeigte, dass drei Viertel der befragten Künstler sich vorstellen können, KI als unterstützendes Werkzeug zu nutzen. Der kreative Prozess im Zusammenhang mit KI kann an sich auch als neuartige Kunstform gesehen werden. Betrachtet man den Prozess und nicht nur die daraus resultierenden Bilder, so fällt diese Form in die Kategorie der Konzeptkunst, da der Künstler die Möglichkeit hat, wie beim Design mit DALL-E 2, in der Rolle des Kuratierens und Optimierens zu handeln. In Zukunft wird es immer mehr konzeptionelle Arbeiten geben, da immer mehr Künstler KI-Werkzeuge adaptieren und lernen, wie sie den kreativen Prozess der KI-Kunst beeinflussen können.

Fazit

Zusammenfassend konnte festgestellt werden, dass KI grundlegend kreativ sein kann. KI-Kunst an sich kann als neue Kunstform gesehen werden. Auch wenn man eine KI selbst als Künstler betrachtet, so kann behauptet werden, dass sie kreative Eigenschaften besitzt. Jedoch gibt es auch menschliche kreative Eigenschaften, die KI nicht beherrscht. Bei der Recherche fiel auf, dass es im Bereich von künstlicher Kreativität nie das Ziel ist, den Menschen durch KI zu ersetzen. Wiederholt konnte festgestellt werden, dass der größte Nutzen dann entstehen kann, wenn solche kreativen KI-Systeme eine Partnerschaft mit dem Menschen eingehen und eine Co-Kreativität bilden.

Bild Timo Haßlinger

Autor Timo Haßlinger

Timo Haßlinger ist Software Developer bei adesso mit Fokus auf Java-Entwicklung. Nebenbei beschäftigt er sich außerdem im Rahmen seines berufsbegleitenden Master Studiums mit Themen aus dem Bereich der Data Science.

Diese Seite speichern. Diese Seite entfernen.