Zephyrnet Logosu

OpenAI CEO'su Sam Altman, Şirketinin Artık GPT-5 Oluşturmaya Başladığını Söyledi

Tarih:

Mart ayında düzenlenen bir MIT etkinliğinde OpenAI kurucu ortağı ve CEO'su Sam Altman, ekibinin henüz bir sonraki yapay zeka olan GPT-5'i eğitmediğini söyledi. “Bir süre olmayacağız ve olmayacağız” seyirciye söyledi.

Ancak bu hafta GPT-5'in durumuyla ilgili yeni ayrıntılar ortaya çıktı.

Bir röportajda, Altman şunları söyledi: Financial Times şirket şu anda GPT-5'i geliştirmek için çalışıyor. Her ne kadar makale modelin eğitim aşamasında olup olmadığını belirtmese de (büyük ihtimalle öyle değil) Altman daha fazla veriye ihtiyaç duyacağını söyledi. Veriler halka açık çevrimiçi kaynaklardan (büyük dil modelleri olarak adlandırılan bu tür algoritmalar daha önce bu şekilde eğitilmişti) ve özel özel veri kümelerinden gelecek.

Bu şununla aynı hizada: OpenAI'nin geçen haftaki çağrısı Kuruluşların, özel veri kümeleri üzerinde işbirliği yapmasının yanı sıra, önde gelen yayıncılardan değerli içerik elde etmek amacıyla önceki çalışmaları için de Associated Press ve Haberler Corp. Bir blog yazısında,Ekip, metin, resim, ses veya video konusunda ortaklık yapmak istediklerini ancak özellikle "insan niyetini" ifade eden "bağlantısız parçalar yerine uzun biçimli yazı veya konuşmalarla" ilgilendiklerini söyledi.

OpenAI'nin halka açık olmayan daha yüksek kaliteli kaynaklardan yararlanmaya çalışması sürpriz değil. Yapay zekanın aşırı veri ihtiyaçları, gelişiminde önemli bir noktadır. ChatGPT gibi sohbet robotlarının arkasındaki büyük dil modellerinin yükselişi, daha fazla veri tüketen giderek daha büyük algoritmalardan kaynaklanıyordu. Bu ikisinden, daha yüksek kalitede daha fazla verinin yakın vadede daha iyi sonuçlar vermesi mümkündür. Güncel araştırma daha büyük miktarda veriyle beslenen daha küçük modelleri önerir Daha az beslenen daha büyük modeller kadar veya onlardan daha iyi performans gösterir.

"Sorun şu ki, diğer üst düzey insan kültürü ürünleri gibi, iyi düzyazı da bilinen evrende üretilmesi en zor şeyler arasında yer alıyor." Ross Andersen şunları yazdı: Atlantik Bu yıl. "Sınırsız miktarda mevcut değil ve yapay zeka için herhangi bir eski metin işe yaramayacak: Kitaplar üzerinde eğitilen büyük dil modelleri, çok sayıda sosyal medya gönderisi üzerinde eğitilenlerden çok daha iyi yazarlar."

GPT-4'ü eğitmek için internetin çoğunu taradıktan sonra, görünen o ki, meyve büyük ölçüde toplanmış. Bir araştırmacı ekibi geçen yıl kamuya açık, Yüksek kaliteli çevrimiçi veriler 2026 yılına kadar tükenecek. En azından yakın vadede bunu aşmanın bir yolu, özel bilgi yığınlarının sahipleriyle anlaşmalar yapmaktır.

Bilgisayar, Altman'ın röportajda değindiği bir diğer engel.

OpenAI'nin GPT-4'ü gibi temel modeller, yapay zekayı eğitmek ve çalıştırmak için yaygın olarak kullanılan bir tür özel bilgisayar çipi olan çok sayıda grafik işleme birimi (GPU) gerektirir. Chipmaker Nvidia, GPU'ların önde gelen tedarikçisidir ve ChatGPT'nin piyasaya sürülmesinden sonra çipleri, teknolojinin en popüler ürünü haline geldi. Altman, yakın zamanda şirketin en yeni H100 yongalarından bir partiyi teslim aldıklarını ve arzın 2024'te daha da gevşemesini beklediğini söyledi.

Daha fazla kullanılabilirliğin yanı sıra yeni çipler de daha hızlı görünüyor.

Bu hafta yayınlanan testlerde Yapay zeka kıyaslama kuruluşu MLPerfÇipler, büyük dil modellerini yalnızca beş ay önce belirlenen hedeften neredeyse üç kat daha hızlı eğitti. (MLPerf'in yapay zeka çiplerini beş yıl önce karşılaştırmaya başlamasından bu yana, genel performans 49 kat arttı.)

Satır aralarını okumak, giderek daha zor hale geldi. endüstri daha az şeffaf hale geldi—Altman'ın bahsettiği GPT-5 çalışması muhtemelen algoritmanın kendisini eğitmekten ziyade gerekli bileşenlerin bir araya getirilmesiyle ilgilidir. Şirket yatırımcılardan finansman sağlamak için çalışıyor.GPT-4'ün eğitimi 100 milyon dolardan fazlaya mal oldu—Nvidia'dan çipler ve ellerine geçen her yerden kaliteli veriler.

Altman, GPT-5'in piyasaya sürülmesi için bir zaman çizelgesi taahhüt etmedi ancak eğitim yakında başlasa bile algoritma bir süre daha gün yüzü göremeyecek. Boyutuna ve tasarımına bağlı olarak eğitim haftalar veya aylar sürebilir. O zaman ham algoritmanın güvenli hale getirilmesi için birçok kişi tarafından stres testine tabi tutulması ve ince ayar yapılması gerekecektir. Şirketi aldı Eğitimden sonra GPT-4'ün geliştirilip piyasaya sürülmesi sekiz ay. Her ne kadar rekabet ortamı artık daha yoğun olsa da, GPT-4'ün GPT-3'ten neredeyse üç yıl sonra geldiğini de belirtmekte fayda var.

Ancak sürüm numaralarına çok fazla kapılmamak en iyisidir. OpenAI mevcut teknolojisiyle hala agresif bir şekilde ilerlemeye devam ediyor. İki hafta önce, onun ilk geliştirici konferansıile şirket, GPT-4 Turbo'nun yanı sıra GPT adı verilen özel sohbet robotlarını da piyasaya sürdü. Geliştirilmiş algoritma, daha güncel bilgiler içerir (kesintiyi Eylül 2021'den Nisan 2023'e kadar uzatır), çok daha uzun istemlerle çalışabilir ve geliştiriciler için daha ucuzdur.

Rakipler de OpenAI'nin peşinde. Google DeepMind şu anda bir sonraki yapay zeka algoritması üzerinde çalışıyor, İkizler burcu ve büyük teknoloji ağır yatırım Anthropic, Character.AI ve Inflection AI gibi diğer önde gelen girişimlerde. Bütün bu eylem Hükümetler düzenlemelere bakıyor algoritmik önyargı, gizlilik endişeleri ve fikri mülkiyet haklarının ihlalinin yol açtığı kısa vadeli riskleri azaltmanın yanı sıra gelecekteki algoritmaları daha güvenli hale getirebileceğini umuyorlar.

Ancak uzun vadede, büyük dil modelleriyle ilgili eksikliklerin daha fazla veri ve daha büyük algoritmalarla mı çözüleceği yoksa yeni atılımlar mı gerektireceği açık değil. İçinde Eylül profili, Kablolu Steven Levy, OpenAI'nin GPT-4'te neyin "katlanarak güçlü bir gelişme" sağlayacağından henüz emin olmadığını yazdı.

OpenAI başkanı Greg Brockman Levy'ye şunları söyledi: "Kaçırdığımız en büyük şey yeni fikirler bulmak." "Sanal asistan olabilecek bir şeye sahip olmak güzel. Ama rüya bu değil. Hayalimiz, çözemediğimiz sorunları çözmemize yardımcı olmaktır.”

Google'ın 2017 yılıydı transformatörlerin icadı Bu, yapay zekaya şu anki anı getirdi. Birkaç yıl boyunca araştırmacılar algoritmalarını büyüttüler, onlara daha fazla veri sağladılar ve bu ölçeklendirme neredeyse otomatik ve çoğu zaman şaşırtıcı performans artışları sağladı.

Ancak Mart ayındaki MIT etkinliğinde Altman, şunu düşündüğünü söyledi: ölçeklendirme çağı sona erdi ve araştırmacılar algoritmaları daha iyi hale getirmenin başka yollarını bulacaklardı. O zamandan bu yana düşüncesinin değişmiş olması mümkün. En yeni akıllı telefonun bir öncekinden daha iyi olması gibi GPT-5'in de GPT-4'ten daha iyi olması mümkündür ve bir sonraki adım değişikliğini mümkün kılan teknoloji henüz doğmamıştır. Altman da tam olarak emin görünmüyor.

"Bu modeli eğitene kadar bu bizim için eğlenceli bir tahmin oyunu gibi olacak" dedi FT. "Bu konuda daha iyi olmaya çalışıyoruz çünkü güvenlik açısından yetenekleri tahmin etmenin önemli olduğunu düşünüyorum. Ancak GPT-4'ün yapmadığı şeyin tam olarak ne olacağını size söyleyemem."

Bu arada, bizi meşgul edecek fazlasıyla şeyimiz olacak gibi görünüyor.

Resim Kredi: Maksim Berg / Unsplash

spot_img

En Son İstihbarat

spot_img