DALL-E

aus Wikipedia, der freien Enzyklopädie
Von DALL-E 2.0 generiertes Bild zum Text “A Shiba Inu dog wearing a beret and black turtleneck”

DALL-E (stilisiert als DALL·E) ist ein von OpenAI entwickeltes Computerprogramm, das Bilder aus Textbeschreibungen erstellen kann. Der Name bildet ein Portmanteau aus WALL-E und dem spanischen Künstler Salvador Dalí.[1] Das Programm nutzt künstliche neuronale Netzwerke, ⁣um Wörter als Input in Anordnungen von Pixeln als Output zu transferieren. Mithilfe von Textanordnungen können von dem Programm fotorealistische Bilder erstellt werden.[2] Die künstliche Intelligenz kann dabei völlig neue Konzepte abbilden und Bilder in verschiedenen künstlerischen Stilrichtungen kreieren.[3] Um Bilder erzeugen zu können, wurde das Modell mithilfe von Millionen im Internet verfügbaren Bildern trainiert. Das Programm basiert auf dem ebenfalls von OpenAI entwickelten Generative Pre-trained Transformer 3 (GPT-3), einem Textgenerator, welcher Texte, Textzusammenfassungen und sogar Gedichte verfassen kann.[4]

DALL-E wurde am 5. Januar 2021 von OpenAI vorgestellt.[5] Bei der Ankündigung hieß es, die Software befinde sich noch in der Forschungsphase und der Zugang sei auf vorab ausgewählte Betanutzer beschränkt. Das Modell kann immer noch schwerwiegende Fehler machen, auch solche, die kein Mensch machen würde.[6] Die verbesserte Version DALL-E 2.0 wurde im April 2022 vorgestellt.[7] Öffentlich verfügbar ist seit 2022 die weniger leistungsfähige Version Craiyon (anfangs bekannt als DALL-E mini), welche auf dem Quellcode von DALL-E beruht. Die surrealen Bilder des Modells wurden prompt von Internetnutzern zur Erstellung von Memes benutzt.[8][9]

Die Leistungsfähigkeit des Modells wurde als „beeindruckend“[1] und „unheimlich“[10] bezeichnet. So wurde DALL-E von einigen Beobachtern aufgrund seiner scheinbaren Kreativität als mögliche Vorstufe zu Artificial General Intelligence interpretiert und als Zeichen für die starken Fortschritte im Machine Learning angesehen. Andere betonten, dass es sich bei DALL-E um keine mit dem Menschen vergleichbare Intelligenz handelt, da es keinerlei generelles Verständnis von Konzepten ausweist. Zudem würde es weiterhin viele Fehler machen, welche auf seinem fundamental fehlenden Verständnis der physischen Welt und der Objekte in ihr beruhen.[11] Das Modell könnte dennoch starken Einfluss auf Künstler und Grafikdesigner haben.[12] Die Generierung von Desinformation und gefälschten Bildern wurde in einem Artikel der New York Times befürchtet.[13] Auch könnte das Programm eine kulturelle Voreingenommenheit besitzen, da es allein auf der englischen Sprache beruht und die Bilder zum Training des Programms zum größten Teil aus dem westlichen Kulturkreis stammen und generierte Bilder deshalb stereotype Vorstellungen widerspiegeln können.[8]

Weblinks

Commons: DALL-E – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

  1. a b AI draws dog-walking baby radish in a tutu. In: BBC News. 6. Januar 2021 (bbc.com [abgerufen am 25. Juni 2022]).
  2. Vladimir Alexeev: Kann DALL-E 2 fotorealistische Bilder erzeugen? In: MIXED. 19. Juni 2022, abgerufen am 25. Juni 2022 (deutsch).
  3. OpenAI’s DALL-E creates plausible images of literally anything you ask it to. In: TechCrunch. Abgerufen am 25. Juni 2022 (amerikanisches Englisch).
  4. Farhad Manjoo: Opinion | How Do You Know a Human Wrote This? In: The New York Times. 29. Juli 2020, ISSN 0362-4331 (nytimes.com [abgerufen am 25. Juni 2022]).
  5. DALL·E: Creating Images from Text. In: OpenAI. 5. Januar 2021, abgerufen am 25. Juni 2022 (englisch).
  6. Move over Photoshop: OpenAI has just revolutionized digital image making. In: Fortune. Abgerufen am 25. Juni 2022 (englisch).
  7. DALL·E 2. In: OpenAI. Abgerufen am 25. Juni 2022 (englisch).
  8. a b Jörg Breithut: DALL-E 2 und Google Imagen: Die Text-zu-Quatsch-Generatoren. In: Der Spiegel. 18. Juni 2022, ISSN 2195-1349 (spiegel.de [abgerufen am 25. Juni 2022]).
  9. Ana Diaz: People are using DALL-E mini to make meme abominations — like pug Pikachu. In: Polygon. 15. Juni 2022, abgerufen am 25. Juni 2022 (amerikanisches Englisch).
  10. Jeff Parsons: Dall.E mini: The AI image generator everyone's using to make wild memes. In: Metro. 10. Juni 2022, abgerufen am 25. Juni 2022 (englisch).
  11. Gary Marcus: Horse rides astronaut. In: The Road to AI We Can Trust. 28. Mai 2022, abgerufen am 25. Juni 2022.
  12. Artnet News: A New System Called DALL-E Seems to Have Cracked the Code on True AI-Generated Art. The Implications Are Staggering. 13. April 2022, abgerufen am 25. Juni 2022 (amerikanisches Englisch).
  13. Cade Metz: Meet DALL-E, the A.I. That Draws Anything at Your Command. In: The New York Times. 6. April 2022, ISSN 0362-4331 (nytimes.com [abgerufen am 25. Juni 2022]).