Zephyrnet Logosu

Üretken Yapay Zeka ve Semantik Uyumluluk – DATAVERSITY

Tarih:

Üretken yapay zekadan elde edilen sonuçlara dayalı olarak kaç ifadenin yapıldığını yalnızca CPT ve benzerleri bilir. Ama onlardan bir sürü var.

olarak geçmişim veri modelleyici uzun yıllar beni biraz ürpertiyor, çünkü arkadaş canlısı yapay zeka yardımcılarının üretmemize yardım ettiği şey, biz okuyucuların girdiyi işlediği bilişsel süreçlere tabidir, yapay zeka sonuçları, kavranan anlambilim (kendi başımıza), belirli her birimizin zaman içinde oluşturduğu bilgi. Ve AI sonuçlarının benzer (yani karşılık gelen) modelleri izlemesini bekliyoruz. 

Başka bir deyişle, "ChatSome"un eğitim setlerinde yerleşik olan belirli semantiklerle dolaylı olarak uyumlu olmasını beklerdim:

Yoluyla yapılan diyagram WebWOWL – diyagramı okumak için oraya gidin

Yukarıdaki örnekteki semantik ağ, dünya çapındaki web topluluğundan çıkan, iyi bilinen FOAF (Friend of a Friend) ontolojisidir. Dolayısıyla, ChatSome arkadaşlarla ilgili konuları tartışırsa, anlamsal yapıların yukarıdaki standarttan (FOAF) çok farklı olmamasını beklemek doğal olacaktır.

Paylaşılan anlambilim, insan iletişiminde bir gerekliliktir.

Kurtarmaya Mühendislik İstemi?

Görünüşe göre yapay zeka pazarlamacılarının yanıtı şimdilik dikkatli, derlenmiş, "hızlı mühendislik" - çünkü ne sorduğunuzu tanımlayamıyorsanız, herhangi bir yapay zeka (veya insan) nasıl akıllıca yanıt verebilir?

Bakınız, örneğin, Oğuz A. Acar'ın Harvard Business Review'da yayınlanan şu mükemmel makalesi, “AI Prompt Mühendisliği Gelecek Değil"

Makaleyi okumanızı tavsiye ederim, ancak bu alıntıda onun özünü anlayacaksınız: 

"Ancak, etrafını saran vızıltıya rağmen, hızlı mühendisliğin önemi birkaç nedenden dolayı geçici olabilir. İlk olarak, gelecek nesil yapay zeka sistemleri, doğal dili anlamada daha sezgisel ve ustalaşacak ve titizlikle tasarlanmış istemlere olan ihtiyacı azaltacaktır. İkincisi, GPT4 gibi yeni yapay zeka dil modelleri, bilgi istemleri oluşturma konusunda zaten büyük umut vaat ediyor - yapay zekanın kendisi, istem mühendisliğini geçersiz kılmanın eşiğinde. Son olarak, bilgi istemlerinin etkinliği, belirli algoritmaya bağlıdır ve çeşitli yapay zeka modelleri ve sürümlerinde kullanımlarını sınırlar.

Öyleyse, üretken yapay zekanın potansiyelinden yararlanmamızı sağlamaya devam edecek daha kalıcı ve uyarlanabilir bir beceri nedir? Bu problem formülasyonu – sorunları tanımlama, analiz etme ve tasvir etme becerisi.”

Buna uzun bir yoldan katılıyorum. Bu, yapılacak daha çok iş olduğu anlamına gelir. Aslında, bana öyle geliyor ki, en iyimser ve umutlu üretken AI piyasa yapıcılarından bazılarından duyduklarımız, sözde baş karakteri Pippi'ye izin veren İsveçli yazar Astrid Lindgren'in bu ünlü (sözde) sözüyle aynı seviyede. Uzun çorap diyor ki: "Bunu daha önce hiç denemedim, bu yüzden kesinlikle bunu yapabilmem gerektiğini düşünüyorum."

İşte Pippi Longstocking evreninden bir kitap kapağı:

Görüntü kaynağı: Rakuten kobo

Pippi için hiçbir şey zor değildi, atını kaldırmak bile! Bunu belgeleyen en az 14 kitap ve birkaç film var. Çocuklar ve ebeveynleri, bu hikayelerden yetişkinliğe kadar büyülenir. Bu neden bana Kaliforniya'nın bazı bölgelerinden gelen bazı anlatıları hatırlatıyor?

Bununla birlikte, daha dengeli görüşler mevcuttur: Mükemmel yeni kitabında, “DataPreneur'lar – Yapay Zekanın Vaadi ve Geleceğimizi Oluşturan Yaratıcılar,” Bob Muglia, New York Üniversitesi'nden Yann LeCun ve Meta'nın nasıl olduğunu vurguluyor. üzerinden puan "A Path Towards Autonomous Machine Intelligence Version 0.9.2, 2022-06-27"de öğrenme ve kavrama hakkında bazı temel bilgiler:

"İnsan ve insan olmayan hayvanlar, dünyanın nasıl çalıştığına dair muazzam miktarda arka plan bilgisini gözlem yoluyla ve görevden bağımsız, denetimsiz bir şekilde anlaşılmaz derecede az miktarda etkileşim yoluyla öğrenebiliyor gibi görünüyor. Bu birikmiş bilginin, genellikle sağduyu olarak adlandırılan şeyin temelini oluşturabileceği varsayılabilir. Sağduyu, bir etmene neyin olası, neyin makul ve neyin imkansız olduğunu söyleyebilen dünya modellerinin bir koleksiyonu olarak görülebilir. Hayvanlar bu tür dünya modellerini kullanarak çok az denemeyle yeni beceriler öğrenebilirler. Eylemlerinin sonuçlarını tahmin edebilir, akıl yürütebilir, planlayabilir, keşfedebilir ve sorunlara yeni çözümler hayal edebilirler. Daha da önemlisi, bilinmeyen bir durumla karşılaştıklarında tehlikeli hatalar yapmaktan da kaçınabilirler.”

Aşağıdaki küçük sohbetin gösterdiği gibi, sağduyu kesinlikle incelemeye değer.

Son Sohbet

Geçenlerde GPT 4 ile şu konularda sohbet ettim: veri modelleme. “EN ÖNEMLİ 25 Veri Modeli Türü”nü sordum.

Sonuç geldiğinde Fact Modeling'in listede olmadığını hemen fark ettim. Bunu belirttiğim anda sonuç değiştirildi ve şimdi şöyle görünüyordu:

 "İhmal ettiğim için özür dilerim. Olgu Modeli gerçekten de karmaşık sistemleri modellemek ve iş kurallarını yakalamak için kullanılan önemli bir veri modelleme tekniğidir. Bir sistemin operasyonlarını tanımlayan gerçekleri ve bu gerçekler arasındaki ilişkileri tanımlamaya ve tanımlamaya odaklanır.

Bu nedenle, önemli veri modelleri listesinde Olgu Modeli de yer almalıdır. Gerçek Model de dahil olmak üzere en önemli 25 veri modelinin güncellenmiş listesi aşağıdadır:

    İlişkisel Veri Modeli

    Varlık-İlişki (ER) Veri Modeli

    Nesne Yönelimli Veri Modeli

    Nesne İlişkisel Veri Modeli

    Hiyerarşik Veri Modeli

    Ağ Veri Modeli

    Boyutlu Veri Modeli

    Düz Dosya Veri Modeli

    Anlamsal Veri Modeli

    Kavramsal Veri Modeli

    Mantıksal Veri Modeli

    Fiziksel Veri Modeli

    Veri Ambarı Veri Modeli

    Data Mart Veri Modeli

    XML Veri Modeli

    NoSQL Veri Modeli

    Belge Yönelimli Veri Modeli

    Sütun Ailesi Veri Modeli

    Anahtar/Değer Veri Modeli

    Grafik Veri Modeli

    RDF Veri Modeli

    OWL Veri Modeli

    UML Veri Modeli

    EAV Veri Modeli

    OLAP Veri Modeli

    Gerçek Modeli

Dikkatime sunduğun için teşekkür ederim.”

Ben: Veri kasası ve bağlantı modelleri de önemli veri modeli türleri midir?

“Evet, hem veri kasası hem de çapa modelleri, son yıllarda popülerlik kazanan önemli veri modeli türleridir.

Ücretsiz Araştırma Önizlemesi. ChatGPT kişiler, yerler veya gerçekler hakkında yanlış bilgiler üretebilir." 

***ChatGPT Mart 23 Sürümü ile sohbetin sonu.

Evet, yanlış bilgi üretti. Ve ek bir "hızlı mühendislik" adımında sonuca içerik ekledi.

İçimden şunu söylemek geliyor: Pippi, ödevini yap!

Hayat Geriye Doğru Anlaşılabilir Ama İleriye Doğru Yaşanmalı

Yukarıdaki alt başlık, Danimarkalı filozoftan bir alıntıdır. Soren Kierkegaard:

Görüntü kaynağı: Kraliyet Kütüphanesi, Danimarka, 1923, kamu malı, aracılığıyla Vikipedi

Büyük dil modelleri (LLM'ler), zorunlu olarak, geçmiş olaylarla ilgili geçmiş gerçeklerin ürünleridir. Ancak üretken AI tüketicileri olarak ileriye dönük güvenilir tahminlere ihtiyacımız var. Tüm "transformatörlerin" eski haberler olduğu düşünüldüğünde bile. 

Hem geçmiş hem de gelecek bağlamları anlamak esastır. Aslında, üretici yapay zeka ve sonuçları, bağlam duyarlılığı - başka bir deyişle, anlam, anlam, yapı, ilişkiler, zaman içinde bir egzersizdir.

Gerçek bölünme budur.

Biraz eskimiş LLM içeriğine dayalı üretken tahminler yürütmek, geçen yıldan kalma bir veri ambarında çalışmak gibidir.

LLM'lerin üstüne tahminler eklemek, istatistik olarak da bilinir. Özellikle size bazı kalite ve güven göstergeleri sağlanıyorsa, her şey yolundadır.

Normatif Semantik Standartlara İhtiyaç Var mı?

Biz profesyoneller olarak (veri modelleyiciler ve bilgi bilimcileri), üretici yapay zeka araçlarını kendilerini belirli bir bağlam ve semantikle sınırlayabilmeye zorlamak için bazı sorumlu adımlar atmalıyız. 

Bir kuruluşun kendi veri modelleri ve sözlüğü olabilir, ancak aynı zamanda endüstri veya ülke veya AB resmi ontolojileri ve sözlükleri de olabilir. schema.org ve Vikiveri vb.
Açıkça tanımlanmış bağlamlar sergilemek ve tanımlanmış semantik ile uyumluluk göstermek için AI sonuçlarına ihtiyacımız var.

Bu alanda birçok olasılık var.

Her şeyden önce şunu bilmek isterim:

Bu sonuca göre mi tamamen belgelenebilir, yerleşik gerçekler? Veya kurgusal anlambilim ve iddialar ortaya çıkabilir mi? Başka bir deyişle, bu gerçek mi yoksa kurgu mu? Bu, "Yalnızca onaylanmış gerçekleri içerir" anlamına gelen genel bir etiket üzerinde ısrar etmeye yakındır!

Devlet, finans veya ilaç gibi sıkı bir şekilde düzenlenen bir sektörde olsaydım, sonuçlara güvenebileceğim güveni bilmek isterdim. onlar mı mahkemede tutmak, Örneğin? Çok zamanlı mı (ya da en azından iki zamanlı)?

Bakıyor kalite yönetimi genel olarak (bkz. örneğin, ISO 9000 QMS standartlar) ISO 9000'in Veri Yönetiminin öğrenebileceği birçok yönü vardır. Dolayısıyla, üretken bir yapay zeka sistemi, uyduğu kalite perspektifine göre etiketlenebilir. Bu bir yol açabilir ISO semantik uyumluluk yönetim standardı? ISO 9000 ailesine benzer.

Bir diğer önemli husus ise özgüllük. Başladığımız FOAF ontolojisini düşünün. Aslında, o kadar çok uluslararası ve ulusal standart, sözcük dağarcığı ve endüstri veri modeli var ki, bir uyma AI sonuçları hakkında açıklama.

Burada, Andrew Iliadis'in bu başlıklı son kitabından alınan, İnternet'teki anlamı haritalamak için yararlı olan "normatif" (veya en azından yaygın olarak kullanılan) semantik medyanın birkaç örneğini izleyin (andrewiliadis.com):

Yukarıdakiler sadece birkaç örnek.

Ayrıca ulusal ve uluslararası düzeylerde halka açık pek çok ontoloji, taksonomi, veri modeli, şema ve elinizde ne varsa var. 

Aslında, sahip olduğunuz bazı ev yapımı veri modelleri de var. Kendi semantikleriniz ile üretken bir AI LLM'ninkiler arasında bir uyumluluk testi yapmak güzel olmaz mıydı? Bana sorarsan güzel bir AI ürün özelliği olabilir.

Doğrulanabilir Uyumlu Üretken Yapay Zeka

Finans sektöründe çalışıyor olsaydım, dil modelinin yanı sıra önerilen sonucun FIBO'nun (EDM konseyi tarafından yayınlanan finans sektörü iş ontolojisi) kelime dağarcığı ve semantiğine uygun olup olmadığını bilmek isteyebilirdim. . Buna güvenebilirsem, evimde güvendeyim. Değilse, yasal uyumluluk departmanındaki bir grup meslektaşımla birlikte okumalı, yorumlamalı ve ek sonuçlar çıkarmalıyım. Finans sektöründe bu personel zaten BCBS 239 ile bu yola yönlendirilmektedir. standart entegre taksonomiler ve mimariler istemek. 

Yalnızca sonuçlar değil, aynı zamanda dönüştürücüler ve dil modellerinin diğer bölümleri de doğrulanabilir şekilde uyumlu olmalıdır. 

Dürüst olmak gerekirse, eğer iş ve siyaset daha geniş ölçekte üretici yapay zekaya dayalı olarak yürütülecekse, dünyanın bu seviyelerde kalite güvencesine ihtiyacı olduğuna inanıyorum. Öyleyse, sertifikalı yapay zeka oluşturucuları getirin! Ve biz HI'lı insanlara bir şans verin!

spot_img

En Son İstihbarat

spot_img