Logo Zéphyrnet

Comparaison : DALL-E 3 et Midjourney

Date :

DALL-E 3, la dernière version de la plateforme révolutionnaire d'art visuel d'IA générative d'OpenAI, vient d'être annoncée avec des fonctionnalités révolutionnaires, notamment l'intégration de ChatGPT. Bien que l'annonce soit assez affirmée, nous avons décidé de la mettre en ring pour voir comment elle se comportera.

Préparez-vous à embarquer pour un voyage exaltant à travers les royaumes illimités de la créativité alimentée par l'IA alors que nous opposons deux maestros du numérique dans une confrontation électrisante ! Dans un coin, nous avons l’emblématique Midjourney, un nom devenu synonyme d’imagination visuelle époustouflante. De l’autre côté, un nouveau challenger avec le potentiel de redéfinir le paysage artistique de l’IA – DALLE-3 ! Attachez votre ceinture, car ce choc de titans de l'IA est sur le point de vous emmener dans un voyage en montagnes russes à travers le futur de la créativité !

Comparaison : DALL-E 3 et Midjourney

Bien que DALL-E3 sera libéré à Chat GPT Plus ainsi que Chat GPT Entreprise utilisateurs en octobre, OpenAI a déjà libéré quelques créations DALL-E 3 avec leur invite. Nous mettons donc les mêmes invites à À mi-parcours et voyez ce qui se passe. Alors commençons ce combat !

Tour 1 : À la recherche de l’univers

  • Prompt: « Une illustration d'un cœur humain en verre translucide, debout sur un piédestal au milieu d'une mer agitée. Les rayons du soleil transpercent les nuages, illuminant le cœur, révélant un petit univers intérieur. La citation « Trouvez l'univers en vous » est gravée en lettres grasses à l'horizon.

Il faut d'abord mentionner, comme vous pouvez le constater, que l'écriture n'est pas le point fort de Midjourney. Pour cette raison, des outils d'IA comme Idéogramme capables de générer des images avec écriture sont populaires de nos jours.

L'image DALL-E 3 est très paisible et sereine, et évoque un sentiment de connexion avec l'univers. De plus, l’image Midjourney est plus fantaisiste et ludique. Cependant, nous avons là une erreur d’écriture. Malgré leurs différences, les deux images sont visuellement attrayantes et suscitent la réflexion. Ils nous invitent tous deux à réfléchir sur notre place dans le monde et notre lien avec quelque chose de plus grand que nous-mêmes.

  • La décision: DALL-E 3 remporte cette manche avec sa génération sans faille.

Tour 2 : Quel est le meilleur endroit pour admirer le coucher de soleil ?

  • Prompt: "Un bâtiment architectural moderne avec de grandes fenêtres en verre, situé sur une falaise surplombant un océan serein au coucher du soleil."

Malgré leurs différences, les deux images sont belles et évocatrices. Ils capturent tous deux l’essence de vivre en étroite proximité avec la nature. Même si nous avons une vue dégagée sur le coucher de soleil à DALLE-3, nous devons admettre que « l'ambiance du coucher du soleil » de Midjourney mérite d'être mentionnée.

  • La décision: À mi-parcours gagne.

Round 3 : Salut les rois de la pomme de terre !

  • Rapide: « De minuscules rois de la pomme de terre portant des couronnes majestueuses, assis sur des trônes, supervisant leur vaste royaume de la pomme de terre rempli de sujets et de châteaux de pommes de terre. »

Les deux générations ont échoué sur le même sujet. Selon l'invite, nous devons avoir plusieurs trônes. Mais, dans la génération DALL-E 3, il n'y a pas de trône alors que dans l'image Midjourney nous en avons au moins un.

  • La décision: Bien que les pommes de terre DALL-E 3 ressemblent beaucoup plus à des pommes de terre, nous pouvons voir au moins tout ce qui est mentionné dans l'image de Midjourney. Ainsi, Midjourney gagne.

Tour 4 : La dame de porcelaine

  • Rapide: « Une femme d'âge moyen d'origine asiatique, ses cheveux noirs striés d'argent, semblent fracturés et éclatés, finement noyés dans une mer de porcelaine brisée. La porcelaine scintille de motifs d'éclaboussures de peinture dans un mélange harmonieux de bleus, de verts, d'oranges et de rouges brillants et mats, capturant sa danse dans une juxtaposition surréaliste de mouvement et d'immobilité. Son teint, clair comme la porcelaine, ajoute une qualité presque mystique à sa silhouette.

Le réalisme de la génération Midjourney est à son paroxysme et on l'adore ! Cependant, nous ne pouvons pas dire qu'il y a « une mer de porcelaine brisée » dans cette image. Alors que nous sommes dans la génération DALL-E 3, nous comprenons clairement la touche porcelaine.

  • La décision: DALL-E 3 victoires.

Round 5 : Dansons !

  • Rapide: "Une animation 2D d'un groupe de musique folklorique composé de feuilles d'automne anthropomorphes, chacune jouant d'instruments traditionnels de bluegrass, au milieu d'un décor forestier rustique parsemé de la douce lumière d'une lune de récolte."

Nous avons là un gagnant clair. Bien que la génération Midjourney soit bien présentée, il n'y a pas de feuilles d'automne pour faire de la musique.

  • La décision: DALL-E 3 victoires.

Tour 6 : La chaise

  • Rapide: "Photo d'une chaise sphérique inspirée du litchi, avec un extérieur blanc bosselé et un intérieur moelleux, sur un papier peint tropical."

Oui, vous choisirez probablement Midjourney si vous souhaitez le définir comme fond d'écran. Cependant, dans cette comparaison, la précision des délais compte.

  • La décision: DALL-E 3 victoires.

Tour 7 : Désir du danseur

  • Prompt: « Devant un fond noir profond, une silhouette d'âge moyen, à la peau tongienne riche et éclatante, est capturée en plein tourbillon, ses cheveux bouclés flottant comme une tempête derrière elle. Sa tenue ressemble à un tourbillon de fragments de marbre et de porcelaine. Éclairée par la lueur d’éclats de porcelaine épars, créant une atmosphère onirique, la danseuse parvient à apparaître fragmentée tout en conservant une forme harmonieuse et fluide.

DALL-E 3 a failli se faire éliminer malgré son admirable effort ! Dans l’image Midjourney, nous pouvons voir tous les détails de l’invite, mais en mieux.

  • La décision: Le milieu du voyage gagne.

Tour 8 : Allons à la plage et trouvons le « bon » ermite

  • Rapide: "Photographie en gros plan d'un bernard-l'ermite niché dans du sable humide, avec de l'écume de mer à proximité et les détails de sa coquille et la texture du sable accentués."

En fin de compte, nous devons faire un choix serré. Les deux images sont bien représentées et parallèles à l’invite. Pour décider équitablement, nous devons admettre que nous avons recherché le bernard-l'ermite sur Google, et il semble que la biologie de DALL-E 3 soit meilleure que celle de Midjourney. L'image DALL-E 3 a une apparence plus similaire à celle du véritable ermite.

  • La décision: DALL-E 3 victoires.

DALL-E 3 : 5, Milieu du voyage : 3

Nous avons donc un gagnant ! Bien que toutes les générations Midjourney soient bien représentées et visuellement riches, les générations DALL-E 3 étaient plus précises par rapport à l'invite. Pour cette raison, DALL-E 3 mérite la victoire.

Cependant, il faut mentionner que ces générations de DALL-E 3 sont spécialement préparées pour l'annonce, et qu'elles sont probablement la meilleure version d'elles-mêmes. Pendant que nous générions des images Midjourney, nous avons pris les premières versions, pour être honnête. Donc, pour une décision finale, il faudra attendre la sortie finale du DALL-E 3 et le tester à nouveau !


Un merci spécial à Kerem Gulen pour générer des images Midjourney pour cet article.

Crédit d'image en vedette: Google DeepMind/Pexels

spot_img

Dernières informations

spot_img