Zephyrnet-logo

OpenAI biedt nieuwsuitgevers $1 miljoen om hun inhoud te gebruiken

Datum:

OpenAI stelt voor om slechts 1 miljoen dollar te betalen aan nieuwsuitgevers voor het gebruik van hun inhoud om hun grote taalmodellen (LLM's) te trainen.

Het bedrijf onderhandelt naar verluidt ook met een tiental andere uitgevers om rechtszaken wegens inbreuk op het auteursrecht te voorkomen.

Dit komt omdat er verschillende klachten zijn geweest waarin mediaorganisaties en kunstenaars worden genoemd, waarin AI-bedrijven worden beschuldigd van inbreuk op het auteursrecht. De beschuldigingen zijn dat AI-bedrijven gepubliceerde archieven van nieuwsartikelen gebruiken om hun LLM's op te leiden zonder medeweten van de uitgevers.

Een te klein bedrag

A Silicium Hoek: Het rapport merkt op dat, hoewel het bedrag misschien te weinig lijkt gezien de opkomst van het LLM-model ChatGPT, het allemaal terug te voeren is op de aard van de overeenkomst tussen de twee partijen.

Het bedrag, volgens De informatie, is te weinig, zelfs voor kleine nieuwsuitgevers. Als gevolg hiervan kan dit de inspanningen van OpenAI belemmeren.

Afgelopen december zou OpenAI een deal hebben gesloten met uitgeverij Axel Springer, een Duitse uitgeverij achter mediamerken als Politico en Business Insider.

Hoewel de details van de deal vaag bleven, wordt aangenomen dat het om tientallen miljoenen gaat, aldus door The Information geciteerde leidinggevenden.

Lees ook: Microsoft voegt Copilot AI-knop toe aan nieuwe pc-toetsenborden

Meer AI-bedrijven volgen dit voorbeeld

Andere AI-bedrijven proberen naar verluidt ook goede deals te sluiten met nieuwsuitgevers om hun artikelen te gebruiken om LLM’s op te leiden.

Apple, bijvoorbeeld, dat zich inspant om OpenAI en Google in te halen op het gebied van generatieve AI, probeert ook een deal te sluiten met nieuwsuitgevers, volgens een door The Information aangehaalde directeur.

Het bedrijf biedt naar verluidt ook meer geld aan nieuwsuitgevers dan Open AI, omdat het rechten wil hebben om inhoud “op grotere schaal” te gebruiken dan zijn tegenhangers.

Bronnen die dicht bij de ontwikkelingen staan, hebben aangegeven dat Apple de voorkeur geeft aan een breder gebruik van de inhoud voor “toekomstige AI-producten op een manier die het bedrijf noodzakelijk acht.”

Het bedrijf heeft al overeenkomsten gesloten met nieuwsuitgevers als NBC News, Vogue, The New Yorker, The Daily Beast en Better Homes and Gardens in een deal ter waarde van $ 50 miljoen.

Geen gratis maaltijden in AI

LLM's zijn vooraf getraind enorme hoeveelheden gegevens. Maar die data zijn niet gratis, zo lijkt het. Aan alles hangt een prijskaartje, inclusief de gegevens die worden gebruikt om de LLM's te trainen. Onlangs hebben mediaorganisaties als The New York Times, Reuters, CNN en Vox Media, het moederbedrijf van Vogue, OpenAI en Microsoft Corp. de toegang tot hun gegevens ontzegd.

Afgelopen december werden OpenAI en Microsoft geslagen met een proces door The Times waarin wordt beweerd dat de twee technologiegiganten auteursrechtelijk beschermde inhoud gebruikten om hun modellen te trainen.

Dat is niet alles. Reddit Inc. ging achter alle bedrijven aan die de inhoud gebruikten om hun LLM's op te leiden. Populaire schrijvers hebben ook samengewerkt en rechtszaken aangespannen tegen AI-bedrijven die auteursboeken gebruikten bij het opleiden van hun LLM’s.

Volgens Silicon Angle “zal het opleiden van LLM’s erg duur zijn.”

Naast de datakosten

De kosten van LLM-training gaan verder dan de beschikbaarheid van gegevens. Volgens Forbes, “er zijn duizenden Graphics Processing Units of GPU’s voor nodig, die de parallelle verwerkingskracht bieden die nodig is om de enorme datasets te verwerken waarvan deze modellen leren.”

GPU's alleen al kosten miljoenen dollars. Forbes geeft een technisch overzicht van OpenAI's GPT-3-taalmodel en schat dat elke trainingssessie voor minstens $ 5 miljoen aan GPU's nodig heeft. Er zijn meer trainingsruns nodig, wat de kosten nog verder verhoogt.

spot_img

Laatste intelligentie

spot_img