Zephyrnet Logosu

Kurumsal yapay zeka için veri yönetişimi neden önemlidir? - IBM Blogu

Tarih:

Kurumsal yapay zeka için veri yönetişimi neden önemlidir? - IBM Blogu



Planlama, ağ oluşturma ve e-posta için gece iş kadını ile dizüstü bilgisayar, odak ve tablet. Veri incelemesi, yönetişim, teknoloji ve kadın çalışanla profesyonel ve taahhüt ve teklif için ofiste araştırma

Son zamanlarda elde edilen başarı yapay zeka merkezli büyük dil modelleri piyasayı yapay zekanın birçok kurumsal süreci nasıl dönüştürebileceği konusunda daha iddialı düşünmeye itti. Ancak tüketiciler ve düzenleyiciler hem kendi verilerinin hem de yapay zeka modellerinin güvenliği konusunda giderek daha fazla endişe duymaya başladı. Yapay zekanın güvenli ve yaygın biçimde benimsenmesi, tüketicilere, kuruluşlara ve düzenleyicilere güven sağlamak için veri yaşam döngüsü boyunca Yapay Zeka Yönetişimini benimsememizi gerektirecektir. Peki bu neye benziyor?

Çoğunlukla, yapay zeka modelleri oldukça basittir; verileri alır ve daha sonra bir çıktı oluşturmak için bu verilerden kalıplar öğrenirler. ChatGPT ve Google Bard gibi karmaşık büyük dil modelleri (LLM'ler) de farklı değil. Bu nedenle, yapay zeka modellerinin dağıtımını yönetmeye ve yönetmeye çalıştığımızda öncelikle yapay zeka modellerinin üzerinde eğitim aldığı verileri yönetmeye odaklanmalıyız. Bu Veri yönetimi kullandığımız tüm verilerin kökenini, hassasiyetini ve yaşam döngüsünü anlamamızı gerektirir. Herhangi bir Yapay Zeka Yönetişim uygulamasının temelidir ve bir dizi kurumsal riskin azaltılmasında çok önemlidir.

Yüksek Lisans modellerini hassas veriler üzerinde eğitmenin riskleri

Büyük dil modelleri, belirli kurumsal kullanım durumlarını karşılamak için özel veriler üzerinde eğitilebilir. Örneğin bir şirket ChatGPT'yi alıp şirketin CRM satış verileriyle eğitilen özel bir model oluşturabilir. Bu model, satış ekiplerinin aşağıdaki gibi sorulara yanıt bulmasına yardımcı olmak için bir Slack sohbet robotu olarak kullanılabilir. “Geçen yıl X ürünü kaç fırsat kazandı?"Veya "Z ürününün Y şirketiyle ilgili fırsatı hakkında beni bilgilendirin".

Bu LLM'lerin herhangi bir sayıda müşteri hizmetleri, İK veya pazarlama kullanım senaryolarına göre ayarlandığını kolayca hayal edebilirsiniz. Hatta bu hukuki ve tıbbi tavsiyelerin arttığını, LLM'leri sağlık hizmeti sağlayıcıları tarafından kullanılan birinci basamak teşhis aracına dönüştürdüğünü bile görebiliriz. Sorun şu ki, bu kullanım senaryoları, LLM'lerin hassas özel veriler konusunda eğitilmesini gerektiriyor. Bu doğası gereği risklidir. Bu risklerden bazıları şunlardır:

1. Gizlilik ve yeniden kimlik belirleme riski 

Yapay zeka modelleri eğitim verilerinden öğrenir, peki ya bu veriler özel veya hassassa? Belirli kişileri tanımlamak için önemli miktarda veri doğrudan veya dolaylı olarak kullanılabilir. Dolayısıyla, bir yüksek lisans eğitimini bir kuruluşun müşterileri hakkındaki özel veriler konusunda eğitiyorsak, bu modelin tüketiminin hassas bilgileri sızdırmak için kullanılabileceği durumlarla karşılaşabiliriz.

2. Model içi öğrenme verileri

Birçok basit yapay zeka modelinin bir eğitim aşaması ve ardından eğitimin duraklatıldığı bir dağıtım aşaması vardır. LLM'ler biraz farklıdır. Onlarla konuşmanızın içeriğini alırlar, bundan öğrenirler ve ona göre yanıt verirler.

Bu, yalnızca başlangıç ​​eğitim verileri hakkında endişelenmemize gerek kalmadığından, model giriş verilerini yönetme işini çok daha karmaşık hale getirir. Ayrıca modelin her sorgulanmasında endişeleniyoruz. Konuşma sırasında modele hassas bilgileri aktarırsak ne olur? Hassasiyeti tespit edip modelin bunu başka bağlamlarda kullanmasını engelleyebilir miyiz?

3. Güvenlik ve erişim riski 

Eğitim verilerinin duyarlılığı bir dereceye kadar modelin duyarlılığını belirler. Verilere erişimi kontrol etmek (kimin hangi verilere eriştiğini izlemek ve ardından duruma göre verileri dinamik olarak maskelemek) için iyi kurulmuş mekanizmalarımız olmasına rağmen, yapay zeka dağıtım güvenliği hâlâ gelişiyor. Bu alanda ortaya çıkan çözümler olmasına rağmen, modeli kullanan kişinin rolüne bağlı olarak model çıktısının hassasiyetini hala tam olarak kontrol edemiyoruz (örneğin, model belirli bir çıktının hassas olabileceğini tanımlıyor ve daha sonra güvenilir bir şekilde çıktıyı değiştiriyor). LLM'yi kimin sorguladığına bağlı olarak çıktı). Bu nedenle bu modeller, model eğitiminde yer alan her türlü hassas bilgi için kolayca sızıntı haline gelebilir.

4. Fikri Mülkiyet riski 

Bir modeli Drake'in her şarkısı için eğittiğimizde ve ardından model Drake'in kopyalarını üretmeye başladığında ne olur? Model Drake'in haklarını ihlal ediyor mu? Modelin bir şekilde çalışmanızı kopyalayıp kopyalamadığını kanıtlayabilir misiniz? 

Bu sorun hala düzenleyiciler tarafından çözülüyor, ancak bu durum herhangi bir biçimde büyük bir sorun haline gelebilir. üretken yapay zeka sanatsal fikri mülkiyetten öğrenir. Bunun gelecekte büyük davalara yol açacağını ve eğitimde kullanılan herhangi bir verinin IP'sinin yeterince izlenmesiyle bu durumun hafifletilmesi gerekeceğini umuyoruz.

5. Onay ve DSAR riski 

Modern veri gizliliği düzenlemesinin ardındaki temel fikirlerden biri rızadır. Müşteriler, verilerinin kullanılmasına izin vermeli ve verilerinin silinmesini talep edebilmelidir. Bu, yapay zeka kullanımı için benzersiz bir sorun teşkil ediyor.

Bir yapay zeka modelini hassas müşteri verileri üzerinde eğitirseniz bu model, söz konusu hassas veriler için olası bir maruz kalma kaynağı haline gelir. Bir müşteri, verilerinin şirket tarafından kullanımını iptal ederse (GDPR için bir gereklilik) ve eğer şirket zaten veriler üzerinde bir model eğitmişse, modelin esasen hizmet dışı bırakılması ve iptal edilen verilere erişim olmadan yeniden eğitilmesi gerekir.

Yüksek Lisans'ları kurumsal yazılım olarak kullanışlı kılmak, şirketlerin verilerin güvenliğine güvenebilmesi ve Yüksek Lisans'ın veri tüketimine ilişkin bir denetim izine sahip olabilmesi için eğitim verilerinin yönetilmesini gerektirir.

Yüksek Lisans'lar için veri yönetimi

LLM mimarisinin gördüğüm en iyi dökümü şuradan geliyor: bu makale a16z tarafından yazılmıştır (aşağıdaki resim). Gerçekten iyi yapılmış, ancak tüm zamanımı veri yönetişimi ve gizliliği üzerinde çalışarak geçiren biri olarak, "bağlamsal veriler → veri hatları"nın sol üst bölümünde bir şeyler eksik: Veri yönetimi.

ortaya çıkan LLM uygulama yığını

Eğer eklersen IBM veri yönetişimi çözümlerde sol üst kısım biraz daha şuna benzeyecek:

Bağlamda LLM uygulama yığını ve veri yönetişim çözümü

The veri yönetimi çözümü IBM Knowledge Catalog tarafından desteklenen, gelişmiş veri keşfinin, otomatik veri kalitesinin ve veri korumanın kolaylaştırılmasına yardımcı olacak çeşitli yetenekler sunar. Yapabilirsiniz:

  • Tutarlı bir anlayış için verileri otomatik olarak keşfedin ve iş bağlamı ekleyin
  • Self servis veri keşfini etkinleştirmek için verileri kataloglayarak denetlenebilir bir veri envanteri oluşturun
  • Veri gizliliği ve düzenleme gerekliliklerini karşılamak için hassas verileri belirleyin ve proaktif bir şekilde koruyun

Yukarıdaki son adım sıklıkla gözden kaçırılan bir adımdır: Gizliliği Artırma Tekniğinin uygulanması. Hassas şeyleri yapay zekaya beslemeden önce nasıl kaldırabiliriz? Bunu üç adıma ayırabilirsiniz:

  1. Çıkarılması gereken verilerin hassas bileşenlerini belirleyin (ipucu: bu, veri keşfi sırasında oluşturulur ve verilerin "bağlamına" bağlıdır)
  2. Hassas verileri, verilerin kullanılmasına izin verecek şekilde çıkarın (örneğin, referans bütünlüğünü, kabaca eşdeğer istatistiksel dağılımları vb. koruyacak şekilde)
  3. 1) ve 2)'de olup bitenlerin kaydını tutun, böylece bu bilgiler modeller tarafından tüketilirken verileri takip eder. Bu izleme denetlenebilirlik açısından faydalıdır.

IBM watsonx ve veri dokusuyla üretken yapay zeka için yönetilen bir temel oluşturun

İle IBM WatsonxIBM, üretken yapay zekanın gücünü 'yapay zeka geliştiricilerinin' ellerine vermek için hızlı ilerlemeler kaydetti. IBM watsonx.ai, kurumsal kullanıma hazır bir stüdyodur ve geleneksel makine öğrenme (ML) ve yeni üretken yapay zeka tarafından desteklenen yetenekler temel modelleri. Watsonx aynı zamanda amaca uygun bir veri deposu olan watsonx.data'yı da içerir. açık göl evi mimarisi. Hibrit bulut genelinde verilere erişmek ve bunları paylaşmak için sorgulama, yönetişim ve açık veri formatları tarafından desteklenir.

A güçlü veri temeli Yapay zeka uygulamalarının başarısı için kritik öneme sahiptir. Müşteriler, IBM veri dokusuyla, watsonx.ai ve watsonx.data kullanan yapay zeka geliştiricileri tarafından kolayca erişilmeden önce verileri elde etmek, hazırlamak ve düzenlemek için veri entegrasyonu ve veri yönetişimi yeteneklerini kullanarak yapay zeka için doğru veri altyapısını oluşturabilir.

IBM, şekillendirilebilir bir çözüm sunuyor veri dokusu çözümü üçüncü taraf bulutlara dağıtılabilen açık ve genişletilebilir bir veri ve yapay zeka platformunun parçası olarak. Bu çözüm, veri yönetişimi, veri entegrasyonu, veri gözlemlenebilirliği, veri kökeni, veri kalitesi, varlık çözümü ve veri gizliliği yönetimi yeteneklerini içerir.

Kurumsal yapay zeka için veri yönetimini kullanmaya başlayın

Yapay zeka modelleri, özellikle de Yüksek Lisanslar, önümüzdeki on yılın en dönüştürücü teknolojilerinden biri olacak. Yeni yapay zeka düzenlemeleri yapay zeka kullanımına ilişkin yönergeler dayattığından, yalnızca yapay zeka modellerini yönetmek ve yönetmek değil, aynı derecede önemli olarak yapay zekaya eklenen verileri yönetmek de kritik önem taşıyor.

IBM veri yapısının yapay zeka yolculuğunuzu nasıl hızlandırabileceğini tartışmak için danışmanlık randevusu alın IBM watsonx.ai ile ücretsiz deneme sürenizi başlatın

Yapay zeka hakkında daha fazlası

IBM Watson Assistant ve NICE CXone, CCaaS'de yeni bir bölüm için yetenekleri birleştiriyor

4 min kırmızı - Her şeyin anında gerçekleştiği bir çağda, olumlu bir müşteri deneyimi sağlamak işletmeler için en önemli öncelik haline geldi. Müşterilerin üçte biri (%32) tek bir kötü deneyimden sonra sevdikleri markadan ayrılacaklarını söylerken (kaynak: PWC), kuruluşlar artık özellikle canlı temsilcileri ve iletişim merkezleri aracılığıyla bu deneyime büyük yatırımlar yapıyor. Birçok kuruluş için bu yatırım, bulut tabanlı Hizmet Olarak İletişim Merkezi (CCaaS) platformlarına geçerek çağrı merkezlerini modernleştirmeyi içeriyor. CCaaS çözümleri…

4 min kırmızı

ChatGPT'nin risklerini ve alternatiflerini araştırmak: Güvenilir yapay zekaya giden yolu açmak

6 min kırmızı - Arkadaşlarınızın keyifle tüketeceği bir smoothie hazırlıyorsunuz. Zaten çeşitli meyveler ve yoğurtla karıştırılmış olan arkadaşınız Ruchir, olgun bir elmayla gelir ve canlandırıcı şaheserinizi tamamlamanız için onu size verir. Artık tamamlandı, içecek dökülürken neredeyse hala elma kokusunu duyabiliyorsunuz. İlk yudumunuzdan önce Ruchir şöyle diyor: "Fikrimi değiştirdim, gitmem gerekiyor ve elmayı geri istiyorum." Şöyle yanıtlıyorsunuz: “Ah, kusura bakmayın ama bu sadece…

6 min kırmızı

Suzhou Universal Chain Technology'nin IBM hibrit bulut ve yapay zeka yazılımıyla dijital olarak yeniden şekillendirilmesi

5 min kırmızı - Suzhou Universal Chain Technology Company (bundan böyle Suzhou Universal Chain olarak anılacaktır) ve IBM China, kısa bir süre önce Suzhou Universal Chain'in kurumsal uygulama bütünleştirme platformunun ve IBM hibrit bulut ve yapay zeka yazılımını kullanan iş süreci otomasyon yönetim platformunun başarılı bir şekilde geliştirildiğini duyurdu. Bu, altı aylık özverili çabaların ardından elde edildi ve şirketin dijital olarak daha gelişmiş ve akıllı bir işletmeye dönüştürülmesi için temel atıldı. Araştırma ve geliştirme (Ar-Ge) ve…

5 min kırmızı

AI'dan yararlanın ve işinizi daha iyi hale getirmek için kullanın

7 min kırmızı - Yapay zekanın (AI) benimsenmesi burada. Kuruluşlar artık yapay zeka yeteneklerini ekleyip eklemeyeceklerini değil, hızla gelişen bu teknolojiyi nasıl kullanmayı planladıklarını soruyor. Aslında, yapay zekanın iş dünyasında kullanımı, küçük, kullanım durumuna özel uygulamaların ötesinde, yapay zekayı iş operasyonlarının stratejik merkezine yerleştiren bir paradigmaya doğru gelişiyor. Çalışanlar, daha derin içgörüler sunarak ve tekrarlayan görevleri ortadan kaldırarak, projelerde işbirliği yapmak, yenilikçi ürünler geliştirmek gibi benzersiz insani rolleri yerine getirmek için daha fazla zamana sahip olacak.

7 min kırmızı

spot_img

En Son İstihbarat

spot_img