Zephyrnet-logo

GitHub beschuldigd van het variëren van de uitvoer van Copilot om copyright te vermijden

Datum:

GitHub zou zijn Copilot-programmeerassistent hebben afgesteld om kleine variaties van de opgenomen trainingscode te genereren om te voorkomen dat uitvoer wordt gemarkeerd als een directe kopie van gelicentieerde software.

Deze bewering verscheen donderdag in de gewijzigde klacht [PDF] tegen Microsoft, GitHub en OpenAI via Copilot's gedocumenteerd voorliefde voor het reproduceren van openbaar geposte, open source gelicentieerde code van ontwikkelaars.

De rechtszaak, aanvankelijk afgelopen november ingediend beweert namens vier niet-geïdentificeerde ("J. Doe") eisers dat Copilot - een code-suggestietool gebouwd op OpenAI's Codex-model en gecommercialiseerd door Microsoft's GitHub - is getraind op openbaar geposte code op een manier die in strijd is met auteursrechtwetgeving en softwarelicentievereisten en dat het de code van andere mensen presenteert als zijn eigen code.

Microsoft, GitHub en OpenAI probeerden om de zaak te laten seponeren, maar slaagde er alleen in schud enkele claims van je af. De rechter liet de belangrijkste auteursrecht- en licentiekwesties intact en stond de eisers toe verschillende andere claims met meer details opnieuw in te dienen.

De gewijzigde aanklacht – die nu betrekking heeft op acht in plaats van twaalf – bevat beschuldigingen van schending van de Digital Millennium Copyright Act, contractbreuk (open source-licentieschendingen), oneerlijke verrijking en oneerlijke concurrentieclaims.

Het voegt verschillende andere beschuldigingen toe in plaats van de beschuldigingen die zijn teruggestuurd voor herziening: contractbreuk (verkoop van gelicentieerd materiaal in strijd met het beleid van GitHub), opzettelijke inmenging in toekomstige economische betrekkingen en nalatige inmenging in toekomstige economische betrekkingen.

De herziene klacht voegt een extra "J. Doe” eiser wiens code Copilot naar verluidt heeft gereproduceerd. En het bevat voorbeeldcode geschreven door de eisers die Copilot zogenaamd woordelijk heeft gereproduceerd, hoewel alleen voor de rechtbank - de codevoorbeelden zijn geredigeerd om te voorkomen dat de eisers worden geïdentificeerd.

De rechter die toezicht houdt op de zaak heeft de eisers toegestaan ​​anoniem te blijven in gerechtelijke dossiers vanwege geloofwaardige bedreigingen met geweld [PDF] gericht aan hun advocaat. Het register begrijpt dat de eisers bekend zijn bij de gedaagden.

Een sluw plan?

De juridische indiening van donderdag zegt dat GitHub in juli 2022, als reactie op openbare kritiek op Copilot, een door de gebruiker aanpasbaar Copilot-filter heeft geïntroduceerd met de naam "Suggesties die overeenkomen met openbare code" om te voorkomen dat softwaresuggesties worden weergegeven die het werk van andere mensen dupliceren.

"Wanneer het filter is ingeschakeld, controleert GitHub Copilot codesuggesties met hun omringende code van ongeveer 150 tekens tegen openbare code op GitHub", GitHub's documentatie legt uit. "Als er een match of bijna match is, wordt de suggestie niet aan u getoond."

De klacht beweert echter dat het filter in wezen waardeloos is omdat het alleen controleert op exacte overeenkomsten en niets doet om output te detecteren die enigszins is gewijzigd. In feite suggereren de eisers dat GitHub probeert weg te komen met schendingen van auteursrechten en licenties door de output van Copilot te variëren zodat het niet lijkt alsof het exact is gekopieerd.

"In de handen van GitHub is de neiging tot kleine cosmetische variaties in de uitvoer van Copilot een functie, geen bug", zegt de gewijzigde klacht. "Deze kleine cosmetische variaties betekenen dat GitHub aan Copilot-klanten onbeperkte gewijzigde kopieën van gelicentieerd materiaal kan leveren zonder ooit het woordelijke codefilter van Copilot te activeren."

De rechtszaak wijst erop dat machine learning-modellen zoals Copilot een parameter hebben die bepaalt in welke mate de output varieert.

“Op basis van informatie en geloof heeft GitHub de temperatuurinstelling van Copilot geoptimaliseerd om zo vaak mogelijk kleine cosmetische variaties van de gelicentieerde materialen te produceren, zodat GitHub code aan Copilot-gebruikers kan leveren die op dezelfde manier werkt als letterlijke code, terwijl hij beweert dat Copilot produceert slechts één procent van de tijd woordelijke code', zegt de gewijzigde aanklacht. "Copilot is een ingenieuze methode van softwarepiraterij."

GitHub van Microsoft drong in een e-mail anders aan.

"We zijn er vast van overtuigd dat AI de manier waarop de wereld software bouwt zal veranderen, wat zal leiden tot een hogere productiviteit en vooral gelukkiger ontwikkelaars", aldus een woordvoerder van het bedrijf. Het register. “We zijn ervan overtuigd dat Copilot zich houdt aan de toepasselijke wetten en we hebben ons vanaf het begin toegewijd aan verantwoord innoveren met Copilot. We zullen blijven investeren in en pleiten voor de AI-aangedreven ontwikkelaarservaring van de toekomst.”

OpenAI reageerde niet op een verzoek om commentaar. ®

spot_img

Laatste intelligentie

spot_img

Chat met ons

Hallo daar! Hoe kan ik u helpen?