DALL-E 3, die neueste Version der bahnbrechenden generativen KI-Plattform für visuelle Kunst von OpenAI, wurde gerade mit bahnbrechenden Funktionen, einschließlich der ChatGPT-Integration, angekündigt. Obwohl die Ankündigung ziemlich durchsetzungsfähig ist, haben wir beschlossen, sie in einen Ring zu legen, um zu sehen, wie sie funktionieren wird.
Bereiten Sie sich auf eine aufregende Reise durch die grenzenlosen Bereiche der KI-gestützten Kreativität vor, während wir zwei digitale Meister in einem elektrisierenden Showdown gegeneinander antreten lassen! In einer Ecke haben wir das ikonische Midjourney, ein Name, der zum Synonym für umwerfende visuelle Fantasie geworden ist. In der anderen Ecke ein neuer Herausforderer mit dem Potenzial, die KI-Kunstlandschaft neu zu definieren – DALLE-3! Schnall dich an, denn dieser Kampf der KI-Titanen nimmt dich mit auf eine Achterbahnfahrt durch die Zukunft der Kreativität!
Vergleich: DALL-E 3 vs. Midjourney
Obwohl DALL-E 3 wird freigegeben ChatGPT Plus Und ChatGPT Enterprise Benutzer im Oktober hat OpenAI bereits freigegeben einige DALL-E 3-Kreationen mit ihrer Eingabeaufforderung. Also haben wir die gleichen Eingabeaufforderungen gestellt Mitten auf der Reise und sehen, was passiert. Also, lasst uns diesen Kampf beginnen!
Runde 1: Das Universum finden
- Prompt: „Eine Illustration eines menschlichen Herzens aus durchscheinendem Glas, das auf einem Sockel inmitten einer stürmischen See steht. Sonnenstrahlen durchdringen die Wolken, erhellen das Herz und offenbaren ein winziges Universum darin. Das Zitat „Finde das Universum in dir“ ist in fetten Buchstaben über den Horizont geätzt.“
Wir müssen zunächst erwähnen, dass das Schreiben, wie Sie sehen, nicht die Stärke von Midjourney ist. Aus diesem Grund mögen KI-Tools Ideogramm die in der Lage sind, Bilder mit Schrift zu erzeugen, erfreuen sich heutzutage großer Beliebtheit.
Das DALL-E 3-Bild ist sehr friedlich und gelassen und ruft ein Gefühl der Verbundenheit mit dem Universum hervor. Außerdem ist das Midjourney-Bild skurriler und verspielter. Allerdings haben wir da einen Schreibfehler. Trotz ihrer Unterschiede sind beide Bilder optisch ansprechend und regen zum Nachdenken an. Beide laden uns ein, über unseren Platz in der Welt und unsere Verbindung zu etwas Größerem als uns selbst nachzudenken.
- Die Entscheidung: DALL-E 3 gewinnt diese Runde mit seiner makellosen Generation.
Runde 2: Wo kann man den Sonnenuntergang am besten beobachten?
- Prompt: „Ein modernes architektonisches Gebäude mit großen Glasfenstern, gelegen auf einer Klippe mit Blick auf den ruhigen Ozean bei Sonnenuntergang.“
Trotz ihrer Unterschiede sind beide Bilder schön und eindrucksvoll. Beide fangen die Essenz des Lebens in unmittelbarer Nähe zur Natur ein. Obwohl wir bei DALLE-3 eine klare Sicht auf den Sonnenuntergang haben, müssen wir zugeben, dass Midjourneys „Sonnenuntergangsstimmung“ eine Erwähnung wert ist.
- Die Entscheidung: Midjourney gewinnt.
Runde 3: Ein Hoch auf die Kartoffelkönige!
- Prompt: „Winzige Kartoffelkönige tragen majestätische Kronen, sitzen auf Thronen und beaufsichtigen ihr riesiges Kartoffelreich voller Kartoffeluntertanen und Kartoffelburgen.“
Beide Generationen sind am gleichen Thema gescheitert. Der Aufforderung zufolge benötigen wir mehrere Throne. Aber in der DALL-E 3-Generation gibt es keinen Thron, während wir im Midjourney-Bild mindestens einen haben.
- Die Entscheidung: Obwohl DALL-E 3-Kartoffeln viel mehr Kartoffeln ähneln, können wir zumindest alles sehen, was im Midjourney-Bild erwähnt wird. Midjourney gewinnt also.
Runde 4: Die Porzellandame
- Prompt: „Eine Frau mittleren Alters asiatischer Abstammung, deren dunkles Haar von silbernen Strähnen durchzogen ist, wirkt gebrochen und zersplittert, kompliziert eingebettet in ein Meer aus zerbrochenem Porzellan. Das Porzellan glänzt mit Farbspritzern in einer harmonischen Mischung aus glänzenden und matten Blau-, Grün-, Orange- und Rottönen und fängt ihren Tanz in einer surrealen Gegenüberstellung von Bewegung und Stille ein. Ihr Hautton, ein heller Farbton wie das Porzellan, verleiht ihrer Figur eine fast mystische Note.“
Der Realismus der Midjourney-Generation ist auf höchstem Niveau, wir lieben es! Wir können jedoch nicht sagen, dass sich in diesem Bild „ein Meer aus zerbrochenem Porzellan“ befindet. Während wir uns in der DALL-E 3-Generation befinden, verstehen wir den Porzellan-Touch deutlich.
- Die Entscheidung: DALL-E 3 gewinnt.
Runde 5: Lasst uns tanzen!
- Prompt: „Eine 2D-Animation einer Volksmusikband, bestehend aus anthropomorphen Herbstblättern, die jeweils traditionelle Bluegrass-Instrumente spielen, inmitten einer rustikalen Waldkulisse, die vom sanften Licht eines Erntemondes gesprenkelt wird.“
Da haben wir einen klaren Sieger. Obwohl Midjourneys Generation gut präsentiert ist, gibt es kein Herbstlaub, um Musik zu machen.
- Die Entscheidung: DALL-E 3 gewinnt.
Runde 6: Der Stuhl
- Prompt: „Foto eines von Litschi inspirierten kugelförmigen Stuhls mit einer holprigen weißen Außenseite und einer weichen Innenseite vor einer tropischen Tapete.“
Ja, Sie würden wahrscheinlich Midjourney wählen, wenn Sie es als Hintergrundbild festlegen möchten. Bei diesem Vergleich kommt es jedoch auf die schnelle Genauigkeit an.
- Die Entscheidung: DALL-E 3 gewinnt.
Runde 7: Wunsch des Tänzers
- Prompt: „Vor einem tiefschwarzen Hintergrund ist eine Figur in mittleren Jahren, deren tongaische Haut satt und strahlend ist, mitten im Wirbeln eingefangen, ihr lockiges Haar weht wie ein Sturm hinter ihr her.“ Ihre Kleidung gleicht einem Wirbelsturm aus Marmor- und Porzellanfragmenten. Erleuchtet durch den Glanz verstreuter Porzellanscherben, die eine traumhafte Atmosphäre schaffen, schafft es die Tänzerin, fragmentiert zu wirken, behält aber dennoch eine harmonische und fließende Form.“
DALL-E 3 wäre trotz seiner bewundernswerten Leistung fast ausgeschieden! Im Midjourney-Bild können wir jedes Detail der Aufforderung sehen, aber besser.
- Die Entscheidung: Midjourney gewinnt.
Runde 8: Lasst uns an den Strand gehen und den „richtigen“ Einsiedler finden
- Prompt: „Nahaufnahme eines Einsiedlerkrebses, eingebettet in nassen Sand, mit Meeresschaum in der Nähe und hervorgehobenen Details seines Panzers und der Textur des Sandes.“
Am Ende müssen wir eine knappe Entscheidung treffen. Beide Bilder sind gut dargestellt und parallel zur Eingabeaufforderung. Um eine faire Entscheidung zu treffen, müssen wir zugeben, dass wir den Einsiedlerkrebs gegoogelt haben, und es scheint, dass die Biologie von DALL-E 3 besser ist als die des Midjourney. Das DALL-E 3-Bild ähnelt eher dem echten Einsiedler.
- Die Entscheidung: DALL-E 3 gewinnt.
DALL-E 3: 5, Midjourney: 3
Wir haben also einen Gewinner! Obwohl alle Midjourney-Generationen gut vertreten und visuell reichhaltig waren, entsprachen die DALL-E 3-Generationen der Aufforderung genauer. Aus diesem Grund hat DALL-E 3 den Sieg verdient.
Allerdings müssen wir erwähnen, dass diese DALL-E 3-Generationen speziell auf die Ankündigung vorbereitet wurden und höchstwahrscheinlich die beste Version ihrer selbst sind. Während wir Midjourney-Bilder erstellt haben, haben wir der Fairness halber die ersten Versionen genommen. Für eine endgültige Entscheidung müssen wir also auf die endgültige Veröffentlichung des DALL-E 3 warten und ihn erneut testen!
Besonderer Dank an Kerem Gülen für die Erstellung von Midjourney-Bildern für diesen Artikel.
Hervorgehobener Bildnachweis: Google DeepMind/Pexels