Zephyrnet-logo

GitHub's Copilot vliegt in zijn eerste open source copyright-rechtszaak

Datum:

Advies GitHub Copilot, de AI-gestuurde, pair-programmeringsservice van Microsoft, is al razend populair. Microsoft heeft voor het eerst de omzet- en abonnementscijfers van GitHub in zijn laatste kwartaalrapport gepubliceerd.

GitHub heeft nu een jaarlijkse terugkerende omzet van $ 1 miljard, een stijging van $ 200 naar $ 300 miljoen toen het werd overgenomen. Het heeft nu 90 miljoen actieve gebruikers op het platform, vergeleken met de 73 miljoen van afgelopen november. Een groot deel van de recente omzet en stijging van het aantal abonnees kan worden toegeschreven aan Copilot. Jammer dat het feest binnenkort voorbij kan zijn.

Toen Copilot voor het eerst de deur uitrolde, maakten slimme mensen zich zorgen omdat het Machine Learning (ML) -model was gebaseerd op OpenAI's Codex; het bevatte code waarop copyright rustte onder een of andere open-sourcelicentie. De Codex was tenslotte getraind op miljarden openbaar beschikbare broncoderegels – inclusief code in openbare repositories op GitHub. Dat omvatte onder andere alle code van de vele projecten van de Apache Foundation.

Het is dan ook geen verrassing dat Matthew Butterick, een advocaat, ontwerper en ontwikkelaar, aankondigde dat hij samenwerkte met Joseph Saveri Law Firm, een groot advocatenkantoor voor class action, om onderzoeken de mogelijkheid om een ​​auteursrechtclaim in te dienen tegen GitHub. Die mogelijkheid is een geworden realiteit.

Op 3 november hebben ze een class action-rechtszaak aangespannen tegen Microsoft en partners bij de US District Court voor het Northern District of California. Hun claim? Copilot is een op AI gebaseerd systeem dat is getraind op openbaar toegankelijk open-source gelicentieerde code [PDF]. Terwijl GitHub beweert dat de code die het produceert voor programmeurs niet alleen maar kopieën van de code zijn, beweert het pak dat het in werkelijkheid precies is wat het is. “Gedaagden beweren dat Codex en Copilot geen kopieën bewaren van de materialen waarop ze zijn getraind. In de praktijk is de Output echter vaak een vrijwel identieke reproductie van code uit de trainingsdata.”

Verder identificeert de “Codex niet de eigenaar van het copyright op deze Uitvoer, noch enige andere – het is niet getraind om Naamsvermelding te geven. Evenmin bevat het een copyrightkennisgeving of enige licentievoorwaarden die aan de uitvoer zijn gekoppeld. Dit is zo ontworpen - Codex is niet gecodeerd of getraind om dergelijke gegevens te reproduceren."

Kortom, ze beweren dat Copilot slechts een copycat is die het auteursrecht schendt.

Microsoft kan de feiten niet tegenspreken. Copilot is gebaseerd op open source-code. De echte vraag is of hun acties het copyright van de code hebben geschonden. Is het "fair use" of is het diefstal van intellectueel eigendom? Dat, mijn vriend, is een ingewikkelde vraag. Het zal niet snel opgelost zijn. Butterick weet dit.

“Dit is de eerste stap in wat een lange reis zal worden. Voor zover we weten, is dit de eerste class action-zaak in de VS die de training en output van AI-systemen betwist. Het zal niet de laatste zijn. AI-systemen zijn niet vrijgesteld van de wet. Degenen die deze systemen maken en gebruiken, moeten verantwoordelijk blijven.”

GitHub beweert natuurlijk: "We hebben ons vanaf het begin toegewijd aan verantwoord innoveren met Copilot en zullen het product blijven ontwikkelen om ontwikkelaars over de hele wereld zo goed mogelijk van dienst te zijn."

Dat zegt niet zoveel, toch?

Microsoft en OpenAI hebben nog geen commentaar gegeven op het pak. Dat komt op tijd. Deze zaak zal niet verdwijnen. Uiteindelijk zullen ze de claims moeten behandelen. Dan, want ik zie geen kans dat dit buiten de rechtbank wordt geregeld, zal het zijn lange, langzame reis door het Amerikaanse rechtssysteem beginnen. Ik verwacht dit decennium geen definitief antwoord.

Ondertussen overwegen open source-leiders nog steeds alle gevolgen van deze rechtszaak. Open Source Initiative (OSI) veteraan Simon Phipps zei op Mastodon dat hij denkt dat “het enige dat veilig is om conclusie op dit punt over Copilot is dat de rechtsonzekerheid het ongeschikt maakt voor gebruik in open-sourceprojecten. '

De Software Freedom Conservancy (SFC) legde uit dat terwijl de “probleem is ernstig en belangrijk”, is niet eenvoudig. Een belangrijk principe van open-source licentiekwesties is bijvoorbeeld: "Gemeenschapsgerichte handhaving mag nooit prioriteit geven aan financieel gewin." Door de aard ervan neigt een class action-rechtszaak ertoe te gaan over financiële compensatie.

De SFC hoopt dat de eisers “deze principes zullen onderschrijven. We delen uw frustratie en woede over het feit dat GitHub van Microsoft zijn inbreuk heeft voortgezet en de weigering van Microsoft en GitHub om met de gemeenschap samen te werken met betrekking tot hun agressieve anti-FOSS-activiteit en ongekende licentieschending. FOSS-licenties gaan echter niet in de eerste plaats over bedrijfsmodellen of financieel herstel. De acties van GitHub met Copilot zijn in de eerste plaats aanstootgevend omdat ze proberen het systeem van copyleft te ondermijnen dat specifiek is ontworpen om ervoor te zorgen dat gebruikers, ontwikkelaars en consumenten allemaal gelijke rechten hebben.”

De gevaren zijn potentieel ook groot voor gebruikers van Copilot. Als de zaak tegen GitHub wint, kan elk laatste stukje code dat je ermee hebt geproduceerd, onderworpen zijn aan verschillende open-sourcelicenties. Als dat u niet afschrikt, praat dan met de advocaten van uw bedrijf. Je merkt misschien dat ze wit worden als ze er eenmaal aan denken.

Vergis je er niet in. Deze rechtszaak – winnen, verliezen of gelijkspelen – zal de manier veranderen waarop we open source software en AI/ML gebruiken. Sterker nog, het zal waarschijnlijk de hele technologiewereld veranderen. Wacht even, we gaan een zware rit tegemoet. ®

spot_img

Laatste intelligentie

spot_img