Zephyrnet Logosu

Karşılaştırma: DALL-E 3 ve Midjourney

Tarih:

OpenAI'nin çığır açan üretken yapay zeka görsel sanat platformunun en son sürümü olan DALL-E 3, ChatGPT entegrasyonu da dahil olmak üzere çığır açan özelliklerle kısa süre önce duyuruldu. Duyuru oldukça iddialı olsa da nasıl bir performans sergileyeceğini görmek için onu incelemeye almaya karar verdik.

İki dijital ustayı heyecan verici bir hesaplaşmada karşı karşıya getirirken, yapay zeka destekli yaratıcılığın sınırsız diyarlarında heyecan verici bir yolculuğa çıkmaya hazırlanın! Bir köşede, akıllara durgunluk veren görsel hayal gücüyle eşanlamlı hale gelen ikonik Midjourney var. Diğer köşede ise yapay zeka sanat ortamını yeniden tanımlama potansiyeline sahip yeni bir rakip var: DALLE-3! Kemerlerinizi bağlayın, çünkü AI devlerinin bu çatışması sizi yaratıcılığın geleceğine doğru bir rollercoaster yolculuğuna çıkarmak üzere!

Karşılaştırma: DALL-E 3 ve Midjourney

Rağmen DALL-E3 serbest bırakılacak Sohbet GPT Plus ve ChatGPT Kurumsal Ekim ayındaki kullanıcılar için OpenAI zaten serbest istemleriyle bazı DALL-E 3 kreasyonları. Yani, aynı istemleri koyduk yolculuk ve ne olacağını görün. O halde haydi bu mücadeleye başlayalım!

1. Tur: Evreni Bulmak

  • İstemi: “Fırtınalı bir denizin ortasında bir kaide üzerinde duran, yarı saydam camdan yapılmış bir insan kalbinin illüstrasyonu. Güneş ışığının ışınları bulutları delerek kalbi aydınlatır ve içindeki küçücük evreni ortaya çıkarır. 'İçinizdeki evreni bulun' sözü ufka doğru kalın harflerle kazınmış."

Öncelikle şunu belirtmemiz gerekiyor, gördüğünüz gibi yazmak Midjourney'in güçlü tarafı değil. Bu nedenle, AI araçları gibi İdeogram Yazıyla görüntü oluşturabilen cihazlar günümüzde popüler.

DALL-E 3 görüntüsü çok huzurlu ve dingindir ve evrenle bir bağ duygusu uyandırır. Ayrıca Yolculuk Ortası görüntüsü daha tuhaf ve eğlenceli. Ancak orada yazım hatamız var. Farklılıklarına rağmen her iki görüntü de görsel olarak çekici ve düşündürücüdür. Her ikisi de bizi dünyadaki yerimiz ve kendimizden daha büyük bir şeyle olan bağlantımız üzerine düşünmeye davet ediyor.

  • Karar: DALL-E 3 kusursuz jenerasyonuyla bu raundu kazanıyor.

2. Tur: Gün batımını izlemek için en iyi yer neresidir?

  • İstemi: “Gün batımında sakin okyanusa bakan bir kayalığın üzerinde yer alan, büyük cam pencereli modern mimari bir bina.”

Farklılıklarına rağmen her iki görüntü de güzel ve çağrıştırıcıdır. Her ikisi de doğaya yakın yaşamanın özünü yakalıyor. DALLE-3'te gün batımını net bir şekilde görebilmemize rağmen, Midjourney'in “gün batımı titreşiminin” bahsetmeye değer olduğunu kabul etmeliyiz.

  • Karar: Yolculuğun ortasında kazanır.

3. Tur: Patates krallarına selam olsun!

  • istemi: “Görkemli taçlar giyen, tahtlarda oturan, patates tebaaları ve patates kaleleriyle dolu geniş patates krallıklarını denetleyen minik patates kralları.”

Her iki nesil de aynı konuda başarısız oldu. İsteme göre birden fazla tahtımız olması gerekiyor. Ancak DALL-E 3. nesilde taht yokken Midjourney imajında ​​en az bir taht var.

  • Karar: DALL-E 3 patatesleri daha çok patateslere benzese de, en azından Midjourney görselinde bahsedilen her şeyi görebiliyoruz. Yani Midjourney kazanır.

4. Tur: Porselen Bayan

  • istemi: “Asya kökenli orta yaşlı bir kadın, koyu renk saçları gümüş çizgilerle kaplı, kırık ve parçalanmış, kırık porselen denizinin içine girift bir şekilde gömülmüş gibi görünüyor. Porselen, parlak ve mat mavilerin, yeşillerin, turuncuların ve kırmızıların uyumlu bir karışımındaki sıçrayan boya desenleriyle parlıyor ve dansını hareket ve dinginliğin gerçeküstü bir birleşimiyle yakalıyor. Porselen gibi açık bir ten tonu, formuna adeta mistik bir hava katıyor.”

Midjourney kuşağının gerçekçiliği en üst seviyede, biz onu seviyoruz! Ancak o görüntüde “kırık porselen denizi” olduğunu söyleyemeyiz. DALL-E 3. nesilde ise porselen dokunuşunu çok net anlıyoruz.

  • Karar: DALL-E 3 galibiyet.

5. Tur: Haydi dans edelim!

  • istemi: "Hasat ayının yumuşak ışığıyla benekli rustik bir orman ortamında, her biri geleneksel bluegrass enstrümanları çalan, antropomorfik sonbahar yapraklarından oluşan bir halk müziği grubunun 2 boyutlu animasyonu."

Orada açık bir kazananımız var. Midjourney kuşağı iyi bir şekilde temsil edilse de müzik yapacak sonbahar yaprakları yok.

  • Karar: DALL-E 3 galibiyet.

6. Tur: Sandalye

  • istemi: “Tropikal bir duvar kağıdının önünde, engebeli beyaz dış cephesi ve peluş iç kısmı olan, liçilerden ilham alan küresel bir sandalyenin fotoğrafı.”

Evet, duvar kağıdı olarak ayarlamak istiyorsanız muhtemelen Midjourney'i seçersiniz. Ancak bu karşılaştırmada hızlı doğruluk önemlidir.

  • Karar: DALL-E 3 galibiyet.

7. Tur: Dansçının arzusu

  • İstemi: “Koyu siyah bir fonun önünde, orta yaşlardaki bir figür, Tongalı cildi zengin ve parlak, kıvrımın ortasında yakalanmış, kıvırcık saçları arkasında fırtına gibi uçuşuyor. Kıyafeti mermer ve porselen parçalarından oluşan bir kasırgayı andırıyor. Dağınık porselen parçalarının ışıltısıyla aydınlanan, rüya gibi bir atmosfer yaratan dansçı, parçalanmış görünmeyi başarıyor ancak uyumlu ve akıcı formunu koruyor.”

DALL-E 3, takdire şayan çabasına rağmen neredeyse nakavt ediliyordu! Yolculuğun Ortası görüntüsünde her anlık ayrıntıyı görebiliriz, ancak daha iyi.

  • Karar: Yolculuğun ortasında kazanır.

8. Tur: Sahile gidelim ve “doğru” keşişi bulalım

  • istemi: "Yakınlarında deniz köpüğü bulunan, kabuğunun detayları ve kumun dokusu vurgulanan, ıslak kumda yuvalanmış bir keşiş yengecinin yakın çekim fotoğrafı."

Sonunda yakın bir görüşme yapmak zorundayız. Her iki görüntü de iyi temsil ediliyor ve istemle paralel. Adil karar vermek için, münzevi yengeci Google'da arattığımızı itiraf etmeliyiz ve görünen o ki DALL-E 3'ün biyolojisi Midjourney'den daha iyi. DALL-E 3 görüntüsü gerçek münzeviye daha çok benzeyen bir görünüme sahiptir.

  • Karar: DALL-E 3 galibiyet.

DALL-E 3: 5, Yolculuk Ortası: 3

Yani bir kazananımız var! Tüm Midjourney nesilleri iyi temsil edilmiş ve görsel açıdan zengin olmasına rağmen, DALL-E 3 nesilleri daha doğru yanıtlar vermiştir. Bu nedenle DALL-E 3 galibiyeti hak ediyor.

Ancak bu DALL-E 3 jenerasyonunun duyuruya özel olarak hazırlandığını ve büyük ihtimalle kendilerinin en iyi versiyonları olduğunu da belirtmemiz gerekiyor. Midjourney görsellerini oluştururken adil olmak adına ilk versiyonları aldık. Dolayısıyla nihai karar için DALL-E 3'ün son sürümünü bekleyip tekrar test etmemiz gerekiyor!


Özel teşekkür etmek Kerem Gülen Bu makale için Yolculuk Ortası görüntüleri oluşturmak için.

Öne çıkan resim kredisi: Google DeepMind/Pexels

spot_img

En Son İstihbarat

spot_img