Zephyrnet-logo

Rapporteerde een Reddit-deal van $ 60 miljoen om AI-modellen te trainen met gebruikersgegevens

Datum:

Reddit heeft naar verluidt een deal van $ 60 miljoen getekend met een niet nader genoemde AI-biz om gebruikersgesprekken over te dragen voor modeltraining.

De deal komt op een moment dat Reddit de belangstelling voor zijn aanstaande beursintroductie wil vergroten. Reddit naar verluidt vertelde potentiële investeerders eerder dit jaar over het contract ter waarde van $60 miljoen, en gaf aan dat de leidinggevenden dit soort overeenkomsten voor het delen van inhoud voor modeltraining in de toekomst zouden kunnen herhalen.

Bloomberg merkte op dat zowel het beursdebuut als de details van de AI-deal onderhevig zijn aan verandering en dat de website verwachte vermelding zou nu al in maart kunnen gebeuren. Reddit reageerde niet onmiddellijk Het register's vragen.

De gebruikers van de site hadden daarentegen genoeg te zeggen over de geruchtendeal van $ 60 miljoen. De reacties varieerden van “Reddit vraagt ​​VEEL te weinig" naar waarom zou iemand betalen tientallen miljoenen dollars voor ‘shitposts’ en “obscuur horrorkunstwerk.”

Meer cynische posters herinnerden aan het plan van Reddit kosten voor API-toegang, wat leidde tot een beperkte gebruikersopstand en sommige forums gingen privé of werden gesloten. Naast dat apps van derden betalen voor interactie met het platform – zorgen Reddit verdient rechtstreeks geld met externe apps of met advertenties die in zijn eigen aanbod worden getoond – de nieuwe prijzen waren een manier om dat te doen verzilveren Makers van AI-modellen zoeken de site af voor trainingsgegevens.

Het is bekend dat er gebruik is gemaakt van Reddit-berichten en/of ingediende links trein neurale netwerken, inclusief OpenAI's GPT-2, in het verleden.

“Goed om te weten dat de API-beperking van Reddit nooit was omdat ze je gegevens wilden beschermen tegen AI-gebruik”, aldus een gebruiker bekend. “Ze beschermden het alleen tegen onbetaald AI-gebruik. Welkom in de saaiste cyberpunk-hel.”

Reddit zou niet de eerste outfit zijn die door gebruikers gegenereerde trainingsgegevens aan AI-spelers aanbiedt, en vermoedelijk valt dat delen onder de gebruiksvoorwaarden. Terwijl van je af slaan claims van schending van het auteursrecht met betrekking tot het gebruik van boeken en gepubliceerde journalistiek bij het trainen van zijn familie van supermodellen, heeft OpenAI dat gedaan beveiligde licentieovereenkomsten met de Associated Press en Axel Springer, en is naar verluidt in gesprekken met CNN, Fox en Time uitdrukkelijk om de artikelen van deze mediaorganisaties te gebruiken voor training.

Hoewel Reddit een uitstekende tijd is om diep in obscure konijnenholen te graven over zaken als sandwiches met gegrilde kaas en schreeuwende vis, het is nog steeds een vrachtwagen vol meningen en persoonlijke ervaringen die de werkelijkheid wel of niet weerspiegelen. We weten niet zeker of we dit allemaal zouden gebruiken voor het bouwen van een definitief taalmodel.

Als een Reddit-gebruiker zet het: “Het wordt een ontzettend stomme AI.” ®

spot_img

Laatste intelligentie

spot_img