Zephyrnet Logosu

ChatGPT: Üretken Yapay Zeka Üzerine ASU+GSV Sonrası Düşünceler

Tarih:

ASU+GSV'de koridor sohbetlerinde defalarca duyduğum soru şuydu: "ChatGPT'den, Geniş Dil Modellerinden (LLM'ler) ve üretken yapay zekadan bahsetmeyen tek bir sunum olacağını mı düşünüyorsunuz?"

Tanıştığım hiç kimse "evet" demedi. Herkesin konuştuğu tek şey yapay zeka gibi görünüyordu.

Ancak yine de söylem biraz GPT-2'in kullanımlarını, güçlü yönlerini ve sınırlamalarını açıklamaya çalışan GPT-5'ye benziyordu. Bir sürü boş sözle doluydu, ara sıra şaşırtıcı içgörüler ve korkunç halüsinasyonlarla eşit oranda serpiştirilmişti. 

Bu netlik eksikliği konferansın veya katılımcıların bir yansıması değildir. Aksine, daha yeni başlayan değişimin büyüklüğünün altını çiziyor. Üretken yapay zeka en az grafik kullanıcı arayüzü, kişisel bilgisayar, dokunmatik ekran ve hatta internet kadar devrim niteliğindedir. İle ilgili kurs sonuçlarını henüz anlamadık.

Yine de GPT-2'den öğrenilen dersler GPT-3'ün vb. oluşturulmasını mümkün kıldı. Bu nedenle bugün, özellikle Eğitim Teknolojisi alanında üretken yapay zeka ile ilgili şimdiye kadar öğrendiğim bazı dersler üzerinde düşünüyorum.

Üretken yapay zeka yok edecek, böylece biz yaratabiliriz

Üretken yapay zeka konusundaki konuşmaların çoğunda aynı cümlede "ChatGPT" ve "eski" kelimeleri bulunuyor. “ChatGPT yazmayı gereksiz kılacak.” “ChatGPT programcıları modası geçmiş hale getirecek.” “ChatGPT eğitimi modası geçmiş hale getirecek.” “ChatGPT, düşünmeyi ve insanları modası geçmiş hale getirecek.” Bu tahminlerin bazıları yanlış olsa da bunların arkasındaki ortak tema doğrudur. Üretken yapay zeka metalaştırıcı bir güçtür. Bu bir yaratıcı yıkım tsunamisidir.

Ders kitabı endüstrisini düşünün. Uzun zamandır e-Okuryazar Okuyucular bilir, hikâyesinin nasıl biteceğini çok düşündüm. Olağandışı ekonomik hendekleri nedeniyle internet tarafından yok edilen veya kesintiye uğrayan son medya ürünü kategorilerinden biridir. Ancak o hendekler birer birer kurutuldu. Satış temsilcileri ordusu fiziksel olarak kampüs kapılarını mı çalıyor? Gitmiş. Bu pahalı baskı üretimi ve dağıtım yeteneklerinin değeri nedir? Gitmiş. Marka itibarı? Çoktan Gitmiş. 

Sadece birkaç gün önce Cengage açıkladı özel sermaye sahibinden 500 milyon dolarlık nakit akışı:

Cengage Group CEO'su Michael E. Hansen şunları söyledi: "Bu yatırım, sektörümüz hakkında derin bilgiye sahip ve değer yaratma konusunda geçmişi olan bir yatırımcı tarafından performansımızın ve stratejimizin güçlü bir şekilde doğrulanmasıdır" dedi. "Borçları Apollo Funds'ın özsermayesiyle değiştirerek, ödenmemiş borçları anlamlı bir şekilde azaltıyoruz ve bize büyüyen işletmelerden oluşan portföyümüze yatırım yapma seçeneği sunuyoruz."Cengage Group, Apollo Funds'tan 500 Milyon Dolarlık Yatırım Duyurdu (prnewswire.com)

Bu, "özel sermaye sahiplerimiz, bir iflas daha yaşamamıza izin vermektense, bize bir nakit desteği daha vermenin daha iyi olacağına karar verdi" anlamında halkla ilişkiler söylemi.

Profesörler, belki de kampüsteki öğrenim tasarımcılarının yardımıyla, kendi öğretme biçimlerine göre ayarlanmış kendi ders kitaplarını tükürmek için bir LLM'yi kullanabildiklerinde, bu sarsılan sektöre ne olacak? Büyük çevrimiçi üniversiteler, kendi yetkinlikleriyle uyumlu ve kendilerinin takip edip ayarlayabilecekleri değerlendirmelere bağlı kendi içeriklerini üretmeye karar verdiklerinde ne olacak? 

LLM halüsinasyon korkusuna aldanmayın. Teknolojinin sıfır insan gözetimi ile mükemmel, tamamlanmış bir taslak üretmesine gerek yoktur (ve üretmemelidir). Uzman insanlardan beklenen işi, tamamlanmış, öğrenciler için güvenli bir müfredat ürünü üretmenin çabaya değer olmasını sağlayacak kadar azaltması gerekiyor. 

Yüksek Lisans destekli bireysel yazarların ders kitabı endüstrisinin yerini alması ne kadar zor olabilir? A son yarışma AI araştırmacılarını, serbest metinden kısa cevaplı soruların puanlanmasında insan muhakemesine uygun sistemler geliştirmeye davet etti. "Kazananlar, otomatik puanların insan mutabakatına kıyasla doğruluğu ve tahminlerinde gözlenen önyargı eksikliği temel alınarak belirlendi." Altı katılımcı bu zorlukla karşılaştı. Altısının tamamı yüksek lisans üzerine inşa edildi. 

Bu, günümüzün tipik bir ders kitabı veya eğitim yazılımı ürünündeki herhangi bir şeyi oluşturmaktan daha zor bir testtir. 

Ders kitabı endüstrisi, yavaş zayıflama hızı nedeniyle özel sermayeden sürekli yatırım alıyor. Yayıncılar, onlara sahip olan gecekondu lordlarının otuz yıllık platformlarını, yirmi yıllık ders kitabı franchise'larını ve 75 dolarlık PDF'leri nakit olarak sağabilmelerine yetecek kadar parayı saçıp attılar. Cengage duyurusunun da gösterdiği gibi bu model şimdiden çökmeye başladı. 

Üretken yapay zekanın bu sektörden geriye kalanların gözle görülür ve hızlı bir şekilde parçalanmasına neden olması ne kadar zaman alacak? En fazla 24 ay öngörüyorum. 

Birçok endüstri gibi Eğitim Teknolojisi de eski ürün kategorileri ve harap binalardan oluşan yıkık şehir bloklarına benzeyen iş modelleriyle doludur. Yerlerine daha iyi bir bina yapılmadan önce bunların yıkılması gerekiyor. Eski modellerin düşüşünü gördükçe yükselişe geçecek yeni modelleri daha iyi anlayacağız. Üretken yapay zeka bir yıkım güllesidir.

“Sohbet” sohbettir

ChatGPT Plus aboneliği için ayda 20$ ödüyorum. Onunla sadece oynamıyorum. Bunu her gün bir araç olarak kullanıyorum. Ve ben buna sihirli bir bilgi telesekreteri gibi davranmıyorum. Bir arama motorunun daha iyi bir sürümünü istiyorsanız Microsoft Bing Chat'i kullanın. ChatGPT'den gerçek değer elde etmek için ona her şeyi bilen bir Oracle gibi değil, daha çok bir meslektaş gibi davranmalısınız. Sizin bilmediğiniz bazı şeyleri biliyor ve tam tersi. Akıllıca ama yanlış olabilir. Eğer buna katılmıyorsanız veya gerekçesini anlamıyorsanız, ona itiraz edebilir veya devam soruları sorabilirsiniz. Sınırlar dahilinde cevabını “yeniden düşünme” yeteneğine sahiptir. Ve bir yere varan sürekli bir sohbete katılabilir. 

Örneğin, bir LLM'yi, insan tarafından oluşturulan bir dizi değerlendirme listesi üzerinde eğiterek yüksek kaliteli değerlendirme listeleri oluşturabilecek şekilde nasıl ayarlayacağımı öğrenmek istedim. Öğrenmem gereken ilk şey Yüksek Lisans'ın nasıl ayarlandığıydı. Birisinin benim için yazmasını sağlamak için ne tür sihirli bilgisayar programlama büyülerine ihtiyacım var?

Görünüşe göre cevap, en azından genel anlamda, hiçbiri değil. LLM'ler düz İngilizce kullanılarak ayarlanmıştır. Kullanıcının metin kutusuna yazabileceği birden fazla giriş çifti ve makineden istenen çıktıyı verirsiniz. Örneğin, Yüksek Lisans'ı yemek tarifleri sağlayacak şekilde ayarlamak istediğinizi varsayalım. Ayarlama “programınız” şöyle görünebilir:

  • Giriş: Çırpılmış yumurtayı nasıl yaparım?
  • Çıktı: [Tarif]

Açıkçası, verdiğiniz tarif çıktısı örneğinin, içerik listesi ve pişirme adımları gibi bir dizi yapılandırılmış bileşene sahip olacağı açıktır. Yeterli örnek verildiğinde Yüksek Lisans kalıpları tanımlamaya başlar. Ona iyi yanıt örnekleri göstererek, bir tür soruya veya isteğe nasıl yanıt vereceğini öğretirsiniz. 

Bunu biliyorum çünkü ChatGPT bana açıkladı. Ayrıca GPT-4 modelinin henüz bu şekilde ayarlanamayacağını, ancak GPT'nin önceki sürümleri de dahil olmak üzere diğer LLM'lerin bunu yapabileceğini de açıkladı. Biraz daha konuşarak LLM'lerin nasıl ayarlandığını, hangilerinin ayarlanabilir olduğunu ve hatta bu canavarlardan birini kendim ayarlamak için gerekli "programlama" becerilerine sahip olabileceğimi öğrenebildim. 

Benim için heyecan verici bir keşif. Her değerlendirme listesi için girişi yazabilirim. Ele alınmasını istediğim önemli ayrıntılar da dahil olmak üzere, istediğim değerlendirme türünü tanımlayabilirim. Ben, Michael Feldstein, gezegendeki en gelişmiş yapay zeka programlarından birinin algoritmasını ayarlamak için gereken "programın" yarısını yazma kapasitesine sahibim. 

Ancak istediğim çıktı, yani bir değerlendirme tablosu genellikle bir tablo olarak ifade edilir. Yüksek Lisans'lar İngilizce konuşur. Tablolar oluşturabilirler ancak anlamlarını İngilizce olarak ifade etmeleri ve ardından bu anlamı tablo formatına çevirmeleri gerekir. Tıpkı benim gibi. Bu komik bir bilmece türü. Normalde istediklerimi İngilizce olarak ifade edebiliyorum ancak bunu başka bir formata nasıl aktaracağımı bilmiyorum. Bu sefer tablonun ne anlama geldiğini İngilizce cümlelerle nasıl ifade edeceğimi bulmam gerekiyor.

Bunun nasıl yapılacağı hakkında ChatGPT ile konuşuyorum. İlk önce bitmiş ürünün nasıl görüneceğini soruyorum. Örnek olarak bir değerlendirme listesi kullanarak bir tablonun sade İngilizce olarak nasıl ifade edileceğini açıklar. 

TAMAM! Bu mantıklı. Bana bir örnek verdiğinde anlarım. Ben bir insan olduğum ve amacımı anladığım için, ChatGPT sadece bir dil modeli olduğu için (bunu bana hatırlatmak ister) bana verdiği şeye ince ayar yapmanın yollarını görebiliyorum. Ama bana temel kavramı öğretti.

Şimdi nasıl dönüştürebilirim çok değerlendirme tablosu tabloları? Tablo sütunlarını, satırlarını ve hücrelerini tanımlamak için tüm bu cümleleri manuel olarak yazmak istemiyorum. Tabloyu bir e-tabloya dönüştürebilirsem (kelime işlem belgesinin aksine), onu CSV olarak dışa aktarabileceğimi biliyorum. Belki bunun faydası olur. ChatGPT'ye şunu soruyorum: "Bir bilgisayar programı bu cümleleri CSV aktarımından oluşturabilir mi?" 

"Neden evet! Tabloda her sütun için başlıklar olduğu sürece program bu cümleleri bir CSV'den oluşturabilir." 

“Benim için bunu yapacak bir program yazabilir misin?” 

"Neden evet! Eğer bana başlıkları verirseniz sizin için bir Python programı yazabilirim.” 

Bir insan bilgisayar programcısının onun çalışmasını kontrol etmesi gerektiği konusunda beni uyarıyor. Her zaman bunu söylüyor. 

Bu özel durumda program o kadar basit ki bu yardıma ihtiyacım olup olmadığından emin değilim. Ayrıca sorduğumda örneklerimi toplu olarak GPT-3 modeline aktaracak bir program yazabileceğini de söylüyor. Ve beni bir kez daha insan programcının çalışmasını kontrol etmesi gerektiği konusunda uyarıyor. 

ChatGPT bana bir LLM'yi değerlendirme listeleri oluşturacak şekilde nasıl ayarlayabileceğimi öğretti. Kendi başıma. Daha sonra, örnek olarak kaç değerlendirme listesi bulunduğuna bağlı olarak modelin nasıl test edileceğini ve daha da geliştirileceğini tartıştık. Sonuçları ne kadar iyi olurdu? Henüz bilmiyorum. Ama öğrenmek istiyorum. 

Değil mi

Yüksek Lisanslar tüm bilgi ve becerilere olan ihtiyacın yerini almayacak

ChatGPT'den ihtiyacım olanı alabilmek için hem bilgi hem de beceriye ihtiyacım olduğuna dikkat edin. Değerlendirme listelerini, iyi bir değerlendirme listesinin neye benzediğini ve bir değerlendirme listesinin amacının nasıl tanımlanacağını anlamam gerekiyordu. Tablo formatı sorununu doğru soruları sorabilecek kadar derinlemesine düşünmem gerekiyordu. İstediğim cevapları alabilmek için konuşma boyunca hedefin ve ihtiyaçların çeşitli yönlerini netleştirmem gerekiyordu. ChatGPT'nin kullanışlılığı, operatörü olarak yeteneklerim ve sınırlamalarımla şekilleniyor ve sınırlandırılıyor. 

Bu dinamik, ChatGPT ile bir eğitim yazılımı modülünün nasıl oluşturulacağını araştırdığımda daha da belirgin hale geldi. Her ne kadar bu görev basit gibi görünse de, çeşitli karmaşıklıklara sahiptir. İlk olarak, iyi tasarlanmış eğitim yazılımı modülleri, öğrenme tasarımı perspektifinden bakıldığında birbiriyle ilişkili birçok parçaya sahiptir. Öğrenme hedefleri değerlendirmeler ve spesifik içerikle ilgilidir. Çoktan seçmeli soru (MCQ) kadar basit bir değerlendirmede bile birbiriyle ilişkili birçok bölüm vardır. “Kök” ya da soru var. Yanlış cevaplar olan “dikkat dağıtıcılar” vardır. Her cevabın pedagojik bir amacı destekleyecek şekilde yazılmış geri bildirimi olabilir. Her soru aynı zamanda her biri belirli bir pedagojik amacı destekleyecek şekilde yazılmış birbirini takip eden birçok ipucuna da sahip olabilir. Bu ilişkileri elde etmek - bunlar anlamsal ilişkiler—doğru, daha etkili öğretim içeriğiyle sonuçlanacaktır. Ayrıca daha iyi öğrenme analitiğini destekleyen yapıyı da içerecektir. 

Daha da önemlisi, bu pedagojik kavramların çoğu, çeşitli farklı öğrenme deneyimleri oluşturmak için faydalı olacaktır. LLM'de öğretmeye çalıştığım ilişkiler kurs yazılımından geliyor. Ancak bu öğrenme tasarımı öğelerinin çoğu, simülasyonları ve diğer öğrenme deneyimlerini tasarlamak için de gereklidir. Yüksek Lisans'a sadece kurs yazılımı hakkında ders vermiyorum. Ben bunu öğretme konusunda öğretiyorum. 

Her neyse, çıktı örnekleri olarak tüm modülleri bir LLM'ye beslemek, yazılımın tüm bu incelikleri ve ilişkileri yakalayacağını garanti etmez. ChatGPT, gerçekleştirmek istediğim görevin bazı karmaşıklıklarını bilmiyordu. Bunları ona açıklamam gerekiyordu. Bir kez "anladığında" sorun hakkında konuşabildik. İçerik örneklerini girdi-çıktı çiftlerine ayırmanın üç farklı yolunu birlikte bulduk. Sistemi mümkün olduğu kadar çok sayıda ilişkiyi ve inceliği yakalayacak şekilde eğitmek için, aynı içeriği Yüksek Lisans'a her üç yolla da beslemek en iyisi olacaktır.

Herkese açık eğitim yazılımı modüllerinin çoğu, bu tür dilimleme ve parçalamayı kolaylaştıracak (hatta mümkün kılacak) şekilde tutarlı ve açık bir şekilde tasarlanmamıştır. Şans eseri, XML'de işaretlenmiş bazı yüksek kaliteli modülleri nereden bulabileceğimi biliyorum. XML ve bu modüllerin onu nasıl kullandığı hakkında biraz bilgim olduğundan, hangi XML'in çıkarılacağı, geri kalanını İngilizceye dönüştürmenin artıları ve eksileri ile onları XML olarak bırakmanın artıları ve eksileri hakkında ChatGPT ile konuşma fırsatım oldu. Yazılıma, modül parçaları arasındaki bazı açık ve örtülü ilişkiler hakkında bilgi vermek ve modülleri giriş-çıkış çiftlerine dönüştürme işini yapacak yazılımın nasıl yazılacağını öğretmek için XML Belge Türü Tanımını (DTD) kullanın. 

Keşif amaçlı sohbetin sonunda başarmak istediğim işin, ChatGPT'nin yardımıyla bile sahip olduğumdan daha fazla yazılım programlama becerisi gerektirdiği açıktı. Ama artık bir programcıdan ne kadar zamana ihtiyacım olduğunu tahmin edebiliyorum. Ayrıca programcının ihtiyaç duyduğu beceri düzeyini de biliyorum. Böylece işi yapmanın maliyetini tahmin edebilirim. 

Bu sonucu elde etmek için, önemli miktarda ön bilgiden yararlanmam gerekiyordu. Daha da önemlisi, anlamlı dil ve eleştirel düşünme becerilerinden yararlanmam gerekiyordu. 

Benimki gibi bir felsefe diplomasının pratik olmadığını söyleyen herkes benim tozumu yiyebilir. Sokrates hızlı bir mühendis. Batılı filozofların çoğu bir tür zincirleme düşünce istemi argümanlarını yapılandırmanın bir yolu olarak. 

Beceri ve bilgi ölmedi. Yazma ve düşünme becerileri kesinlikle değildir. Ne münasebet. Benden şüphe duyuyorsanız ChatGPT'ye şu soruyu sorun: "Öğrencilere Sokrates'in felsefesini ve yöntemini öğretmek onların daha iyi mühendisler olmayı öğrenmelerine nasıl yardımcı olabilir?" Bakın ne diyor? 

(Bu soru için ChatGPT Plus'ta bulunan GPT-4 ayarını kullandım.)

Değerlendirmeler de ölmedi

Yukarıda anlattığım projelerden herhangi birinin, proje tabanlı bir öğrenme görevi olarak nasıl desteklenebileceğini düşünün. Öğrenciler benim sahip olduğum araçların aynısına erişebilirdi: ChatGPT gibi bir Yüksek Lisans ve Bing Chat gibi Yüksek Lisans ile geliştirilmiş bir arama aracı. Sorun şu ki, okul tarafından kendilerine sağlananları kullanmak zorunda kalacaklar. Başka bir deyişle, çalışmalarını göstermeleri gerekecekti. Eğer bir tartışma forumu ve bunun etrafına birkaç alakalı öğretici eklerseniz, gerçekten ilginç bir öğrenme deneyimine sahip olursunuz. 

Bu yazmak için de işe yarayabilir. ChatGPT ile bir sonraki kişisel projem, bir müşteri için yazdığım analiz makalesini teknik incelemeye dönüştürmek (tabii ki onların onayıyla). Zor işi zaten yaptım. Analiz bana aittir. Argüman yapısı ve dil stili bana aittir. Ama yazma tıkanıklığıyla mücadele ediyorum. ChatGPT'yi istediğim formatta yeniden yapılandırmama ve harici bir izleyici kitlesi için bağlam eklememe yardımcı olması için kullanmayı deneyeceğim.

Üretken yapay zekanın metalaştırıcı bir güç olduğuna dair daha önce söylediklerimi hatırlıyor musunuz? Genel yazıyı kesinlikle metalaştıracak. Nasıl ki öğrencilerin matematik ve fizikte hesap makinesi kullanmasından rahatsızsam, bunda da bir sakınca görmüyorum hesap makinesinin onlar için gerçekleştirdiği matematiği anladıklarında. 

Öğrencilerin basit bir nedenden ötürü genel düzyazı yazmayı öğrenmeleri gerekir. Kendilerini olağanüstü şekillerde ifade etmek istiyorlarsa, ister akıllı, hızlı mühendislik ister güzel sanat yoluyla olsun, mekaniği anlamaları gerekir. Genel yazının temelleri yapı taşlarıdır. Daha incelikli mekanikler, insan yazarların üretken yapay zeka tarafından metalaştırılmamak için ekleyebilecekleri değerin bir parçasıdır. İfadede virgül, noktalı virgül ve uzun çizgi arasındaki farklar, etkileyici yazarların yaptığı ince taneli seçimlerdir. Uzun cümlelere karşı kısa cümleler, sıfatların ne zaman ve ne sıklıkta kullanılacağına ilişkin kararlar, benzer ancak aynı olmayan kelimeler arasındaki seçimler, açıklık ve vurgu için paragrafları doğru yerden bölmek vb. gibi. 

Örneğin, daha önce yazdığım bir makaleyi teknik incelemeye dönüştürmeme yardımcı olması için Yüksek Lisans'ı kullansam da, onu yeni bir blog yazısı yazmak için kullandığımı göremiyorum. İçindeki değer e-Okuryazar yeni fikirleri kesinlik ve netlikle iletme yeteneğimde yatıyor. Yüksek Lisans eğitiminin benim cümle yapılarımı taklit edebileceğinden hiç şüphem olmasa da, profesyonel zanaatımın temelinde yer alan ifade edici düşünce çalışması için bana bir kısayol sunmasının bir yolunu göremiyorum.

Eğer öğrencilerin… şey… sıradan düzyazı yazmayı öğrenmelerine yardımcı olmak için Yüksek Lisans'ları kullanabilirsek, o zaman onlar da yüksek lisans “hesap makinelerini” iletişim “fizik” derslerinde kullanmaya başlayabilirler. Düşünce netliklerine ve gerçekten mükemmel iletişimlerine odaklanabilirler. Bu düzeyde ifade mükemmelliğini nadiren öğretebiliyoruz. Şimdi belki bunu daha geniş bir temelde yapabiliriz. 

Mevcut evrim durumlarında, Yüksek Lisanslar bilgi çalışması için 3 boyutlu yazıcılar gibidir. İnsan emeğini uygulamadan tasarıma kaydırıyorlar. Yapmaktan yaratmaya. Daha fazla yanıt bilmekten daha iyi sorular sormaya. 

Kısmen ekonomimizin 20. yüzyılın başındaki montaj hattı işçilerinin beyaz yakalı eşdeğerine ihtiyaç duyması nedeniyle, işgücünün yok edilmesi tehdidiyle ilgili sayısız hikaye okuduk. Tam zamanlı işlerde çalışan insanlar tweet yazıyor. Veya aynı raporun güncellemeleri. Veya İK kılavuzları. Dolayısıyla eğitim sistemimiz bu işe insan yetiştirmek üzere tasarlanmıştır. 

Eğitim gibi insan kitlelerinin de işe yaramaz hale geleceğini varsayıyoruz çünkü insanlara öğreten bir eğitim sistemi hayal etmekte zorlanıyoruz.herşey tüm sosyo-ekonomik katmanlardan insanları daha iyi bilenler ve yapanlar olmaktan ziyade daha iyi düşünenler olmaya davet ediyoruz. 

Ama bunu yapabileceğimize inanıyorum. İşin zor kısmı hayal kurmaktır. Bu konuda eğitim almadık. Belki çocuklarımız bu konuda bizden daha iyi olmayı öğrenirler. Onlara bize öğretildiğinden farklı şekilde öğretirsek. 

Teknolojinin muhtemelen kısa vadeli gelişimi

Ben de dahil olmak üzere yapay zekaya dalmamış olanlar, değişimin hızlı hızı karşısında hayrete düştük. Köşelerin arkasını görebildiğimi iddia etmeyeceğim. Ancak bazı kısa vadeli eğilimler, benim gibi uzman olmayan ve iki ay öncesine göre daha yakından ilgilenen kişiler için zaten fark edilebilir durumda. 

Birincisi, üretken yapay zeka modelleri halihazırda çoğalıyor ve yaklaşmakta olan metalaşmanın ipuçlarını gösteriyor. Bize bu programların her zaman çok büyük ve çalıştırmanın çok pahalı olacağı ve yeni modellerle sadece dev bulut şirketlerinin masaya geleceği izlenimi verildi. Savaş Google'a karşı OpenAI/Microsoft olacak. GPT-4'ün bir trilyondan fazla düğüme sahip olduğu söyleniyor. Bu kadar büyük bir modeli inşa etmek, eğitmek ve çalıştırmak için çok fazla beygir gücü gerekir. 

Ancak araştırmacılar çok daha küçük modellerden etkileyici performans elde etmek için şimdiden akıllı teknikler bulmaya çalışıyorlar. Örneğin, VicuñaBirkaç üniversitedeki araştırmacıların geliştirdiği bir model, en az bir testle GPT-90'ün yaklaşık %4'ı kadar iyi ve yalnızca 12 milyar parametreye sahip. Bunu perspektife koymak gerekirse Vicuña iyi bir dizüstü bilgisayarda çalışabilir. Hepsi. Eğitimin maliyeti 300 dolardı (ChatGPT ve Google Bard'a milyarlarca dolar harcanmıştı). Vicuña, gelecek dalganın erken (kusurlu olsa da) bir örneğidir. Daha hızlı, daha küçük, daha akıllı, daha ucuz ve daha doğru olduğuna dair yeni iddialarla neredeyse her hafta başka bir LLM ortaya çıkıyor gibi görünüyor. 

Benzer bir olay görüntü oluşturmada da yaşanıyor. Apple, donanımında açık kaynaklı Stabil Difüzyon modelini optimize etmek için yazılım desteği sağlamak üzere hızla harekete geçti. Artık Macbook'unuzda iyi bir performansla bir görüntü oluşturma programı çalıştırabilirsiniz. Şirketin yeni nesil Apple Silicon mikroçiplerinde donanım hızlandırmayı sürdüreceğine dair spekülasyonlar okudum.

Stable Diffusion tarafından yorumlandığı şekliyle "Sokrates dizüstü bilgisayarda yazıyor"

Bu modeller her şeyde eşit derecede iyi olmayacaktır. Kurumsal devler yenilik yapmaya devam edecek ve muhtemelen yeni yeteneklerle bizi şaşırtacak. Bu arada, daha küçük, daha ucuz ve açık kaynaklı alternatifler birçok görev için fazlasıyla yeterli olacaktır. Google hoş bir tabir icat etti: "model bahçe." Yakın gelecekte hepsine hükmedecek tek bir model olmayacak, hatta bir model ikilisi olmayacak. Bunun yerine her biri farklı amaçlara en uygun olan birçok modelimiz olacak. 

Bu yazıda daha önce anlattığım eğitim amaçlı kullanım örnekleri nispeten basittir. Önümüzdeki 12 ila 24 ay içinde bu tür öğrenme içerikleri oluşturma becerisinde gelişmeler görmemiz ve sonrasında getirilerin azaldığı bir noktaya gelmemiz mümkündür. Pahalı (ve karbon yoğun) bir model çalıştıran büyük bir bulut sağlayıcısına güvenmek zorunda kalmadan, eğitim Yüksek Lisans'larımızı yerel olarak dizüstü bilgisayarlarımızda (hatta telefonlarımızda) çalıştırıyor olabiliriz. 

Bu artan çeşitliliğin önündeki en büyük engellerden biri teknolojik değil. Bunlar eğitim verileri. Bu modelleri eğitmek için telif hakkıyla korunan içeriğin kullanımına ilişkin sorular henüz çözülmedi. İhlal davaları haşhaş. Eğitimde daha iyi LLM'ler elde etmenin önündeki en büyük kısa vadeli zorluğun, telif hakkı sorunları tarafından engellenmeyen, güvenilir, iyi yapılandırılmış eğitim içeriğine erişim olabileceği ortaya çıkabilir. 

Düşünecek o kadar çok şey var ki…

Bu yazıda kendimi biraz gevezelik ederken buldum. Bu eğilimin düşünülmesi gereken pek çok açısı var. Örneğin. İntihal konusunu atladım çünkü bu konuda zaten çok fazla makale yazıldı. Halüsinasyon sorununa sadece hafifçe değindim. Bana göre bunlar, bu teknolojinin ne işe yaradığını, gelecekte nasıl çalışıp oynayacağımızı, düşünüp yaratacağımızı anlama mücadelemizden kaynaklanan geçici takıntılardır. 

Bu anın eğlenceli kısımlarından biri, sınıf eğitimcilerinden fışkıran ve çok fazla ilgi görmeyen fikirler de dahil olmak üzere, pek çok zihnin olasılıklar üzerinde çalışmasını izlemektir. Bu yaratıcılığın eğlenceli bir örneğini görmek için şuraya göz atın: Öğrenme için ChatGPT'nin ABC'leri Devan Walton tarafından. 

Kendine bir iyilik yap. Keşfetmek. Kendinizi buna bırakın. Yeni bir gezegene indik. Evet, bir kısmı bilinmeyen tehlikelerle karşı karşıyayız. Hala. Yeni bir gezegen. Ve biz de bu işin üzerindeyiz.

Kaskınızı takın ve go.

spot_img

VC Kafe

VC Kafe

En Son İstihbarat

spot_img