Zurück zur Übersicht

Online Magazin

DIE KÜNSTLER DER ZUKUNFT

Künstliche Intelligenz (KI) verändert nicht nur die Wirtschaft und das Gesundheitswesen. Die Technologie hält auch bei kreativen Tätigkeiten Einzug – das beste Beispiel dafür? KI-generierte Kunst. Menschen rund um die Welt erschaffen derzeit KI-Kunst-Memes und erobern damit die sozialen Medien im Sturm. Ein Überblick über die fähigsten Kunst-Generatoren und die gelungensten Memes.

Sie ist einer der Trends, wenn nicht DER Trend, der in diesem Jahr die sozialen Medien im Sturm erobert – Kunst, die durch eine Künstliche Intelligenz (KI) geschaffen wurde. Im Juni machte das KI-generierte Cosmopolitan-Cover Schlagzeilen, im Juli jagte das letzte Selfie der Welt seinen Betrachtern einen Schauer über den Rücken und nun hat TikTok einen Filter eingeführt, der auf einem simplen Text-zu-Bild-Generator basiert. Kein Zweifel: Künstliche Intelligenz erobert die Welt kreativer Prozesse.

Während die populärsten dieser Generatoren vor allem das Verlangen nach Spass und Unterhaltung stillen, tüfteln Google, OpenAI & Co an aufwendigeren Tools: Sie erzeugen durch Texteingaben durchaus fotorealistische Bilder und könnten eine echte kreative Revolution auslösen. Diese Text-Zu-Bild-Modelle sind (noch) nicht frei oder kostenlos zugänglich, aber bieten eine Test-Umgebung plus ausführliche Dokumentation, in die man sich vertiefen kann:

DALL-E 2

Dall-E (der Name leitet sich ab von Pixar-Lieblingsroboter Wall-E und dem surrealistischen Maler Salvador Dali) ist eine 12-Milliarden-Parameter-Version von GPT-3. Sie ist darauf trainiert, Bilder aus Textbeschreibungen zu generieren, wobei ein Datensatz von Text-Bild-Paaren verwendet wird. Die zweite Version kann hochauflösende, fotorealistische Bilder erstellen.


Die beeindruckende Technologie wird im folgenden Video gut verständlich erklärt:

 

IMAGEN

Imagen ist ein Text-zu-Bild-Diffusionsmodell mit einem beeindruckenden Grad an Fotorealismus. Imagen baut auf der Leistung von grossen Transformator-Sprachmodellen beim Verstehen von Text auf und stützt sich auf die Stärke von Diffusionsmodellen bei der hochrealistischen Bilderzeugung.

  • https://imagen.research.google/

    Die Imagen-Webseite bietet zurzeit die Möglichkeit eines “Sneak Peaks” in Form von Demonstrations-Beispielen und ausführlicher Beschreibungen des Prozesses.

    Wer mag, kann sich auch ins bereitgestellte Research Paper (46 Seiten, Stand Mai 2022) vertiefen.


Ein gelungener Video-Beitrag von 2 Minute Papers zeigt auf, wie beeindruckend Googles Text-Zu-Bild-Technologie bereits ist:

Vielleicht werden diese Text-Bild-Generatoren eines Tages Unternehmen den Gang zur Kreativagentur ersparen, wenn eine Visualisierung aus dem Generator völlig ausreichen wird. Vielleicht wird nicht nur ein KI-Kunstwerk eines Tages viel wert sein, sondern der Kunstmarkt insgesamt völlig verändert. Vielleicht wird man nicht mehr unterscheiden können, was echt und was nicht echt ist und die Welt gerät aus den Fugen. Oder es gibt ein neues, stärker reguliertes Internet … oder vielleicht auch nicht. Bisher ist nur eines klar: Die von diesen KI-Programmen generierten Visuals machen das Internet durch zahlreiche Memes (was sonst?) zu einem unterhaltsameren Ort.


Nachfolgend eine kleine Auflistung bekannter und sonderbarer KI-Kreationen, mit Verlinkung zum jeweils verwendeten Tool:

DIE ASTRONAUTIN AUF DEM COSMOPOLITAN-COVER

Für das Titelbild ihrer "A.I. Issue" (DE: "KI-Ausgabe") setzte das Lifestyle-Magazin Cosmopolitan auf die Fähigkeiten von Dall-E. Die Text-Eingabe lautete: “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave” – kommt in etwa hin, oder?

DAS LETZTE SELFIE DER WELT

... veröffentlichte TikTok-User Robot Overloards – und nutzte dazu ebenfalls Dall-E 2, mit der titelgebenden Texteingabe. Das Resultat ist in seinen verschiedenen Varianten relativ verstörend. Auf jeden Fall nichts für Optimisten.


TIERE, WIE WIR SIE NOCH NIE GESEHEN HABEN

Googles Imagen überrascht mit fast ungesehenem Foto-Realismus. Mögen die Text-Vorgaben noch so unrealistisch sein, der Generator scheint nicht an seine Grenzen zu stossen. Doch sieh selbst:

Texteingabe: "A giant cobra snake on a farm. The snake is made out of corn."


Texteingabe: "A photo of a Corgi dog riding a bike in Times Square. It is wearing sunglasses and a beach hat."

 

ALTE UND NEUE MEISTER

Auch echte Kunstwerke, besonders niederländische, sind nicht sicher vor den Roboter-Künstlern …

Texteingabe: "A sea otter in the style of Girl with a Pearl Earring" (erstellt mit Dall-E / OpenAI)





Es gibt allerdings auch zahlreiche Tools, die Usern im Internet bereits gratis oder gegen Gebühren zur Verfügung stehen - und auch entsprechend rege genutzt werden. Die Plattform Night Cafe gibt dem User dabei verschiedene Möglichkeiten zum Vorgehen: Neben dem Text-Zu-Bild-Modell gibt es auch den ”Style Transfer”, der den Stil eines Bilds auf das andere anwendet. Hier beim obigen Bild eine berühmte Fotografie der Mondlandung im Stil eines der bekanntesten Gemäldes des niederländischen Meisters Van Gogh.

 

 

Der Deep Dream Generator setzt auf ein ähnliches System und führt bestehende Bilder zusammen, auch mit beeindruckenden Resultaten, ebenfalls generiert von zahlreichen Usern rund um die Welt.



Aber nochmals kurz zurück zur Kunst...


Das wäre wohl passiert, wenn der impressionistische Maler Claude Monet Seerosen und Sonnenaufgänge langweilig gefunden hätte und stattdessen mehr der Paläontologie zugeneigt gewesen wäre. Diese Bilder sind mit dem KI-Kunst-Tool Dall-E mini entstanden, das zum Meme-Generatoren schlechthin geworden ist.

DALL-E MINI

Der Bildgenerator basiert auf der Software GPT-3 von OpenAI und auf Googles TPU Research Cloud, greift also auf Informationen zu, die in Googles Informations-Hubs gesammelt sind.

Er wurde schon im Jahr 2021 erstellt und erfreut sich spätestens seit Mitte 2022 grosser Beliebtheit.

Der Twitter-Kanal Dall-E Mini Generations sammelt die sonderlichsten Kreationen:  

https://twitter.com/weirddalle 

Quelle: Twitter


Quelle: Twitter

 

Da kriegt man kaum genug, oder? Dall-E erlaubt auch einen bislang unbekannten Einblick in die Binary-Dreams-Redaktion ...

DALL-E MINI x BINARY DREAMS

 

Wer herausfindet, welche Trivadianer*innen auf diesen Bildern abgebildet sind, kriegt von uns ein Glacé spendiert!

HAT DA JEMAND SOMMERFERIEN GESAGT? NUN IST ZEIT FÜR BUSINESS:

TechTalk
KI-Ethik KI im Business

Tech Talk Audio: Responsible AI einfach erklärt
TechTalk
Digitale Transformation KI im Business

TechTalk Audio: Business Analyst
TechTalk
Data Analytics

Diskussionen auf Twitter analysieren