Zephyrnet Logosu

Açık kaynak lisanslarının yapay zeka ile başa çıkmak için gelişmesi gerekiyor

Tarih:

Görüş Özgür yazılım ve açık kaynak lisansları, 1970'lerde ve 80'lerde kodla başa çıkmak için gelişti. Bugün yapay zeka modelleriyle başa çıkmak için yeniden dönüşmesi gerekiyor.

AI, açık kaynaklı yazılımdan doğdu. Ancak, yazılım koduyla başa çıkmak için telif hakkı yasasına dayalı ücretsiz yazılım ve açık kaynak lisansları, yapay zekanın açık kaynak yazılımını besleyen büyük dil modeli (LLM) sinir ağları ve veri kümeleri için uygun değildir. Özellikle birçok programlama veri seti özgür yazılıma ve açık kaynak koduna dayandığından, bir şeyler yapılmalıdır. İşte bu yüzden Stefano Maffulli, Açık Kaynak Girişimi (OSI) yönetici direktör ve bir dizi başka açık kaynak ve yapay zeka lideri, yapay zeka ile açık kaynak lisanslarını her ikisi için de anlamlı olacak şekilde birleştirmek için çalışıyor.

Bunun gerçek dünya üzerinde hiçbir etkisi olmayan bir tür teorik, yasal tartışma olduğunu düşünmeyin, tekrar düşünün. Dikkate almak J. Doe 1 ve arkadaşları GitHub'a karşı. Amerika Birleşik Devletleri Kaliforniya Kuzey Bölge Mahkemesi'ndeki bu davadaki davacılar, Microsoft, OpenAI ve GitHub'ın yapay zeka tabanlı ticari sistemleri OpenAI'nin Codex'i ve GitHub'ın Copilot'u aracılığıyla açık kaynak kodlarını söktüler. Sonuç? Davacılar, "önerilen" kodun, gerekli açık kaynak lisans atıfları olmadan, genel GitHub depolarından kazınmış kodun neredeyse aynı kopyalarından oluştuğunu iddia ediyor.

Bu dava devam ediyor. değiştirilmiş şikayet Dijital Binyıl Telif Hakkı Yasası'nı ihlal etme, sözleşme ihlali (açık kaynak lisansı ihlalleri), haksız zenginleştirme ve haksız rekabet iddiaları ve sözleşme ihlali (GitHub'ın politikalarını ihlal ederek lisanslı materyaller satma) suçlamalarını içerir.

Bu tür bir davanın sadece Microsoft'un sorunu olduğunu düşünmeyin. Öyle değil. Sean O'Brien, Siber güvenlik alanında Yale Hukuk Fakültesi öğretim üyesi ve kurucusu Yale Gizlilik Laboratuvarı, meslektaşım David Gewirtz'e şunları söyledi: "Yakında bir patent trollerini yansıtan trollüğün tüm alt endüstrisi, ancak bu sefer yapay zeka tarafından üretilen işleri çevreliyor. Daha fazla yazar, özel lisanslar altında kod göndermek için yapay zeka destekli araçlar kullandıkça bir geri bildirim döngüsü oluşturulur. Yazılım ekosistemleri, müteşebbis firmaların fesih iddialarına konu olacak tescilli kodlarla kirlenecek.”

O haklı. Onlarca yıldır patent trollerini takip ediyorum. Lisanslama trollerinin "sizin" ChatGPT ve Copilot kodunuzdan sonra geleceğini garanti ederim. 

Alman araştırmacı ve politikacı Felix Reda gibi bazı kişiler, tüm Yapay zeka tarafından üretilen kod kamu malıdır. ABD avukatı Richard Santales, kurucu üyesi SmartEdgeLaw Grubu, Gewirtz'e sözleşme ve telif hakkı yasası sorunları olduğunu gözlemledi. Aynı şey değiller. Santalesa, yapay zeka tarafından üretilen kod üreten şirketlerin "diğer tüm IP'lerinde olduğu gibi, sağlanan materyalleri - yapay zeka tarafından oluşturulan kod dahil - mülkleri olarak kabul edeceğine" inanıyor. Ancak her halükarda, kamu malı kodu, açık kaynak koduyla aynı şey değildir.

Hepsinden önemlisi, veri kümelerinin nasıl lisanslanması gerektiği sorunu var. Var birçok “açık” veri seti çok sayıda açık kaynak lisansı altındadır, ancak genellikle uygun değildir.

Sohbetimizde Açık Kaynak Girişimi'nden Maffulli, yapay zeka ve makine öğrenimi sistemleri tarafından üretilen çeşitli yapıların nasıl farklı yasa ve yönetmeliklere tabi olduğunu ayrıntılarıyla anlattı. Açık kaynak topluluğu, hangi yasaların kendi çıkarlarına en iyi hizmet ettiğini belirlemelidir. Maffulli, mevcut durumu, yazılımın ayrı bir disiplin olarak ortaya çıktığı ve telif hakkının kaynak ve ikili kodlara uygulanmaya başladığı 70'lerin sonları ve 80'lerle karşılaştırdı.

Bugün de benzer bir yol ayrımındayız. TensorFlow, PyTorch ve Hugging Face Hub gibi AI programları, açık kaynak lisansları altında iyi çalışır. Yeni AI yapıları başka bir hikaye. Veri kümeleri, modeller, ağırlıklar vb. geleneksel telif hakkı modeline tam olarak uymaz. Maffulli, teknoloji topluluğunun "hilelere" güvenmek yerine hedeflerimizle daha uyumlu yeni bir şey tasarlaması gerektiğini savundu.

Maffulli'ye göre, özellikle yazılım için tasarlanmış açık kaynak lisansları, yapay zeka yapıları için en uygun olmayabilir. Örneğin, MIT Lisansının geniş özgürlükleri potansiyel olarak bir modele uygulanabilirken, Apache veya GPL gibi daha karmaşık lisanslar için sorular ortaya çıkıyor. Maffulli, açık kaynak ilkelerini veri erişimiyle ilgili düzenlemelerin benzersiz engeller oluşturduğu sağlık gibi hassas alanlara uygulamanın zorluklarını da ele aldı. Bunun kısa versiyonu, tıbbi verilerin açık kaynaklı olamayacağıdır.

Eşzamanlı olarak, çoğu ticari LLM veri seti kara kutulardır. Kelimenin tam anlamıyla içinde ne olduğunu bilmiyoruz. Böylece, Electronic Frontier Foundation'ın (EFF) ifade ettiği gibi, sahip olduğumuz bir duruma geldik. "Çöp İçeri, Gospel Dışarı." EFF, açık verilere ihtiyacımız olduğu sonucuna varıyor.

Maffulli, OSI'nin Open Forum Europe, Creative Commons, Wikimedia Foundation, Hugging Face, GitHub, Linux Foundation, ACLU Mozilla ve Internet Archive ile birlikte ortak bir açık anlayış tanımlaması için bir taslak üzerinde çalıştığını söyledi. kaynak AI ilkeleri. Bu, "yasama organlarıyla yapılan görüşmelerde kritik" olacaktır. Şu anda bile, AB, ABD ve Birleşik Krallık hükümet kurumları yapay zeka düzenlemesi geliştirmek için mücadele ediyor ve ne yazık ki sorunlarla başa çıkmak için yetersiz donanıma sahipler.

Stefano, "temellere dönüş" ile başlamamız gerektiğini söyleyerek sözlerini bitirdi. GNU Manifestosu, çoğu lisanstan önce gelir ve açık kaynak hareketi için "Kuzey Yıldızı" nı belirler. Maffulli, AI sistemlerine uygulandığında ilkelerinin şaşırtıcı bir şekilde alakalı kaldığını öne sürdü. İlk ilkelere odaklanarak yapay zeka ve açık kaynağın bu karmaşık kesişiminde daha iyi yol alabileceğiz. ®

spot_img

En Son İstihbarat

spot_img