Meta, Yapay Zekayı Eğitmek İçin 'Korsan' Kitap Veri Kümesini Kullandığını Kabul Etti

meta logosu

meta logosu Son aylarda her türden hak sahipleri, yapay zeka modelleri geliştiren şirketlere karşı dava açtı.

Listede plak şirketleri, bireysel yazarlar, görsel sanatçılar ve son zamanlarda New York Times yer alıyor. Bu hak sahiplerinin tümü, çalışmalarının uygun bir tazminat ödenmeden kullanılmasına itiraz ediyor.

Birkaçı dava Kitap yazarları tarafından sunulan belgelerde korsanlık bileşeni de bulunmaktadır. Vakalar, Meta ve OpenAI dahil teknoloji şirketlerinin modellerini eğitmek için tartışmalı Books3 veri kümesini kullandığını iddia ediyor.

Books3 veri kümesinin açık bir korsanlık açısı var. Yapay zeka araştırmacısı tarafından oluşturuldu Shawn Baskı Ayağı 2020 yılında 'korsan' site Bibliotik'in kütüphanesini kazıyan kişi. Bu kitap arşivi, dijital arşivleme kolektifi tarafından halka açık olarak barındırılıyordu.Göz' o sırada diğer çeşitli veri kaynaklarının yanı sıra.

^{Bibliotik ve daha önce The Eye'da barındırılan diğer kaynaklar}
göz

Genel vizyon, yaklaşık 195,000 GB boyutunda olan 37'den fazla kitaptan oluşan düz metin koleksiyonunun, yapay zeka meraklılarının yeniliği teşvik edecek daha iyi modeller oluşturmasına yardımcı olabileceği yönündeydi.

AI Boom Telif Hakkı Sorunlarını Tetikliyor

Presser haksız değildi ancak veri seti yalnızca yapay zeka girişimlerinin garajına yardımcı olmadı. Dünyanın en büyük teknoloji şirketlerinden bazıları da bunu keşfetti ve kendi dil modellerini geliştirmek için kullandı.

Yıllar boyunca Books3, dünya çapındaki yapay zeka araştırmacılarına ve meraklılarına yardımcı olarak ücretsiz ve geniş çapta erişilebilir olmaya devam etti. Ancak geçen yıl yapay zeka patlaması ana akıma ulaştığında, kitap yazarları ve yayıncılar bunu fark etti ve ardından misillemede bulundu.

Örneğin, Danimarka korsanlıkla mücadele grubu Rights Alliance Göz'ün kaldırılmasını talep etti Books3'ün kopyası da öyle oldu. Veri seti ayrıca yapay zeka şirketi Huggingface'in web sitesinden de kaldırıldı. telif hakkı ihlali bildirildi, diğerleri ise seçeneklerini değerlendirdi.

Onceki gibi rapor Wired tarafından Bloomberg, Rights Alliance'a BloombergGPT modelinin gelecekteki sürümlerini Books3 kullanarak eğitmeyi planlamadığını ve diğer şirketlerin de muhtemelen kapalı kapılar ardında benzer kararlar aldığını bildirdi.

Meta Kitapların3 Kullanımını Kabul Ediyor

Bunlar dikkat çekici gelişmeler ama her şikayetin vaatlerle çözülmesi mümkün değil. Şirketleri modellerini eğitmek için Books3 veri kümesini kullanmakla suçlayan OpenAI ve Meta'ya karşı çeşitli davalar devam ediyor.

OpenAI ve Meta, konuyu kamuoyunda tartışmak konusunda oldukça temkinli davranırken, Meta bu hafta Kaliforniya federal mahkemesinde daha fazla bağlam sağladı.

Yazar/komedyen Sarah Silverman, yazar Richard Kadrey ve diğer hak sahiplerinin açtığı bir davaya yanıt veren teknoloji devi, "Books3'ün bazı bölümlerinin" Llama AI modelini halka yayınlanmadan önce eğitmek için kullanıldığını itiraf ediyor.

Meta, cevabında şöyle yazıyor: "Meta, Llama 3 ve Llama 1'yi eğitmek için diğer birçok materyalin yanı sıra Books2 veri kümesinin bazı kısımlarını kullandığını itiraf ediyor."

meta kitaplar3 cevap

Araştırma makaleleri de dahil olmak üzere birçok kaynak temelde aynı sonuca vardığı için bu itiraf çok büyük bir sürpriz değil. Books3'ün kullanımına Meta tarafından itiraz edilmese de şirketin bunu yaparken hatalı olup olmadığı sorusu hala devam ediyor.

Meta Telif Hakkı İhlalini Reddetti

Meta'nın cevabı Books3'ün kullanıldığını kabul ediyor ancak diğer çeşitli iddiaları ve iddiaları reddediyor. Örneğin yazarlar, Meta'nın yapay zekasını telif hakkıyla korunan çalışmalar üzerinde izinsiz olarak eğittiğini iddia etti. Cevap bunu doğrudan inkar etmiyor ancak rıza veya tazminatın mutlaka gerekli olmadığını belirtiyor.

Meta, "Bir yanıtın gerekli görüldüğü ölçüde, Meta, Lama'yı eğitmek için telif hakkıyla korunan eserleri kullanmanın gerekli onay, kredi veya tazminatı reddettiğini reddediyor" diye yazıyor.

Yazarlar ayrıca, kitaplarının Books3 veritabanında yer aldığı sürece "hak ihlalinde bulunulan eserler" olarak anıldığını belirtti. Bu, Meta'nın başka bir inkarla yanıt vermesine neden oldu. Şirket, "Meta, Davacıların iddia edilen telif haklarını ihlal ettiğini reddediyor" diye yazıyor.

Adil kullanım

Meta'nın yanıtı çok fazla ek ayrıntı sunmuyor ve dava ilerledikçe tam savunma ortaya çıkacak. Ancak şirketin en azından kısmen adil kullanım savunmasına güvenmeyi planladığı açık.

"Meta'nın, Davacıların tescilli telif hakkıyla korunan çalışmalarının izinsiz kopyalarını yaptığı ölçüde, bu tür kopyalar 17 U.S.C. uyarınca adil kullanım teşkil eder. § 107,” Meta not ediyor.

Adil kullanım açısının bu ve diğer AI davalarının önemli bir parçası olması bekleniyor. Bu sadece 'korsan' kaynaklar için değil, aynı zamanda resmi kanallar aracılığıyla yayınlanan ancak açık izin alınmadan kullanılan içeriklerin kullanımı için de geçerlidir.

Bu hukuki mücadeleler henüz başlangıç aşamasındadır, ancak ihtiyaç duyulması halinde en sonunda Yüksek Mahkeme'ye de gidebilirler. Yapay zeka şirketleri, kural ve düzenlemelerin çok katı olması halinde ilerlemenin sekteye uğrayacağını vurguladı.

Bu haftanın başlarında OpenAI, adil kullanımın hem gerekli hem de kritik olduğunu belirtti. rekabetçi yapay zeka modelleri oluşturma, haber kuruluşlarının isterlerse kapsam dışında kalabileceklerini kaydetti. Söylemeye gerek yok, bu seçenek daha önce mevcut değildi, özellikle de Books3 veritabanı için.

Presser'ın Books3'ü yarattığında veri setinin yapay zekanın geleceğini tanımlayabilecek dönüm noktası niteliğindeki davaların merkezinde yer alacağını asla düşünmediğini varsayıyoruz. Ancak riskler değişti ve iyi niyetli 'arşivleme' çabası artık büyük bir telif hakkı çatışmasının parçası.

Yazarın düzeltilmiş ilk birleştirilmiş şikâyetine Meta'nın verdiği yanıtın bir kopyası mevcuttur burada (pdf)

SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
Kaynak: https://torrentfreak.com/meta-admits-use-of-pirated-book-dataset-to-train-ai-240111/

Üretken Veri Zekası

Meta, Yapay Zekayı Eğitmek İçin 'Korsan' Kitap Veri Kümesinin Kullanıldığını Kabul Ediyor

AI Boom Telif Hakkı Sorunlarını Tetikliyor

Meta Kitapların3 Kullanımını Kabul Ediyor

Meta Telif Hakkı İhlalini Reddetti

Adil kullanım

Green Builder Sürdürülebilirlik Sempozyumu Sunumu – Slaytlar ve Transkript – CleanTechnica

Nickel 28 Capital Ousts CEO'su Anthony Milewski ve Başkan Justin Cochrane, Suistimallere Karşı Liderlik Tasfiyesinde

En Son İstihbarat

Cadillac, Audi ve BMW, ABD Satışlarındaki %100 Elektrikli Satış Payında Artık Lider - CleanTechnica

Flydubai'nin sürekli büyümesi ve filo yenileme projesi yolcu deneyimini artırıyor

5 Ücretsiz Stanford Yapay Zeka Kursu – KDnuggets

Emirates, Dubai – Edinburg rotasını başlatacak, ilk 9 A350 varış noktasını duyurdu

Slot Oyuncu Profilleri: Farklı Türlerdeki Çevrimiçi Slot Oyuncularını Anlamak

30+ Python İpuçları ve Püf Noktaları