Zephyrnet-logo

Vraag een data-ethicus: welke gegevens kunnen worden gebruikt om ChatGPT te stimuleren? – DATAVERSITEIT

Datum:

Miljoenen mensen gebruiken ChatGPT regelmatig om hen zowel op persoonlijk als professioneel vlak te helpen. De vraag van deze maand gaat over de gegevens die worden gebruikt om ChatGPT op te roepen. 

Onze lezer, die vertelde dat ze een ESL-spreker zijn, zou graag willen weten of het ethisch is om ChatGPT samenvattingen van informatie te laten maken (met name cursusoverzichten) om hen te helpen. De samengevatte informatie zou uitsluitend voor persoonlijke doeleinden worden gebruikt en niet online met andere mensen worden gedeeld. Als we dit uitbreiden naar een meer algemene situatie, kunnen we ons afvragen …

Welke gegevens mogen worden gebruikt om ChatGPT te vragen?

Twee kleine kanttekeningen

Voordat we op de vraag ingaan, is het belangrijk om te wijzen op de machtsdynamiek van talen. Er is een enorme hoeveelheid privileges die overeenkomt met het spreken van Engels. Zoveel technologie en wetenschappelijk werk is op het Engels gericht en dat kan mensen die Engels niet als moedertaal spreken, in een relatieve achterstand brengen. De context van het willen gebruiken van een instrument om “een gelijk speelveld te helpen creëren” moet worden meegenomen in ethische overwegingen. Hier is de ervaring van een ESL-spreker ChatGPT gebruiken op manieren die zij nuttig hebben gevonden.

Het andere dat ik zal vermelden is dat ik geen advocaat ben en dat deze column geen juridisch advies is. De informatie in dit antwoord is uitsluitend bedoeld voor educatieve doeleinden. De kwestie van auteursrecht en generatieve AI is een gebied in ontwikkeling en iedereen met specifieke vragen moet advies inwinnen bij een juridische professional.

Copyrightmateriaal en ChatGPT-prompts

Over het algemeen mag u in uw prompt geen materiaal gebruiken dat inbreuk maakt op het auteursrecht zonder de juiste toestemming. Dit is heel duidelijk in ChatGPT's gebruiksvoorwaarden, welke staat:

“U mag onze Services niet gebruiken voor illegale, schadelijke of beledigende activiteiten. U mag bijvoorbeeld onze diensten niet gebruiken op een manier die de rechten van iemand schendt, verduistert of schendt.”

Als u bijvoorbeeld een deel van een auteursrechtelijk beschermd werk zou knippen en plakken uit een artikel dat online is gepubliceerd, en u vraagt ​​ChatGPT om de informatie samen te vatten of te herformuleren, dan maakt u inbreuk op het auteursrecht en staat u buiten spel met de gebruiksvoorwaarden van ChatGPT. . Als u ChatGPT een vraag stelt en u een paragraaf met materiaal van een auteursrechtelijk beschermd werk als achtergrondcontext in uw prompt opgeeft, maakt u mogelijk inbreuk op het auteursrecht. 

Dit is belangrijk om te weten, omdat we in sommige situaties auteursrechtelijk beschermd materiaal kunnen gebruiken als onderdeel van redelijk gebruik, met de juiste bronvermelding. De academische wereld is op deze voorziening gebouwd! Het gebruik van auteursrechtelijk beschermd materiaal in uw PROMPT is echter niet noodzakelijkerwijs hetzelfde. Zoals onderzoeker Anita Toh opmerkt:

“Het landschap van auteursrechtwetten en eerlijk gebruik in relatie tot generatieve AI-tools is nog steeds in ontwikkeling. Terwijl onderzoekers voorheen konden vertrouwen op de fair use-doctrine voor het gebruik van auteursrechtelijk beschermd materiaal in hun onderzoekswerk, introduceert de beschikbaarheid van generatieve AI-tools nu een extra laag van complexiteit. Dit is vooral relevant wanneer de AI zelf gegevens zou kunnen opslaan of gebruiken om zijn eigen algoritmen te verfijnen, wat mogelijk zou kunnen worden beschouwd als een schending van de clausule over niet-commercieel gebruik in de fair use-doctrine.” (SRHE)

Ik kan Anita Toh in dit artikel citeren zonder het auteursrecht te schenden vanwege eerlijk gebruik en correcte toeschrijving. Ik kan dat citaat echter niet in ChatGPT gebruiken als onderdeel van een prompt, omdat dat mogelijk een schending van haar werk zou zijn, zoals ze aangeeft. 

Als u juridisch en ethisch aan de kant wilt blijven, vraag ChatGPT dan niet om auteursrechtelijk beschermd werk samen te vatten waarvoor u niet de juiste toestemming heeft om het te gebruiken.

Persoonlijke of vertrouwelijke gegevens 

Een ander soort gegevens die u niet moet gebruiken om ChatGPT te vragen, zijn persoonlijke gegevens, tenzij u over de juiste toestemmingen, kennisgevingen en overeenkomsten beschikt. Dit wordt ook behandeld in de gebruiksvoorwaarden van ChatGPT. Persoonsgegevens omvatten een reeks gegevens die een persoon kunnen identificeren. Het kan namen, adressen en andere identificerende informatie bevatten. 

Bovendien mogen vertrouwelijke gegevens niet in een prompt worden gebruikt. Dit kunnen gegevens zijn waarvoor u een professionele of persoonlijke plicht heeft om deze niet openbaar te maken. Het kan informatie zijn van uw werkgever of een klant, of het kan eenvoudigweg informatie zijn die door een vriend of kennis wordt gedeeld en waarvan zij u hebben gevraagd deze met niemand te delen. Gebruik die informatie niet in een prompt! 

Houd er rekening mee dat ChatGPT-prompts gepaard gaan met het delen van gegevens en dat gegevens het potentieel hebben om op plaatsen terecht te komen waar u geen controle over heeft.

Maar is ChatGPT niet gebouwd op auteursrechtelijk beschermde trainingsgegevens? 

Dit is een vraag van miljoenen dollars over de vraag of regels voor redelijk gebruik van toepassing zijn in de context van trainingsgegevens. Het is de focus van rechtszaken door auteurs als Sarah Silverman en publicaties als de New York Times. Dit is niet iets waar u als eindgebruiker controle over heeft en de juridische vragen zullen tijd nodig hebben om te worden opgelost. Voorlopig blijkt uit de door OpenAI geplaatste voorwaarden echter duidelijk dat u als gebruiker hun voorwaarden schendt als u in uw prompt inbreuk maakt op het auteursrecht van iemand anders.

Wat kan ik gebruiken in een prompt?

U moet vragen of instructies voor een prompt in uw eigen woorden formuleren. U kunt ook materiaal in uw prompt gebruiken waarvoor u het auteursrecht bezit of waarvoor u over de juiste contractuele toestemming beschikt om het te gebruiken. Ik zou bijvoorbeeld een script kunnen nemen dat ik heb geschreven en ChatGPT vragen het te herschrijven. In het geval van een ESL-spreker kunt u uw eigen werk of formulering in de prompt gebruiken en ChatGPT vragen u te helpen bij het herschrijven of herformuleren ervan. Hierbij wordt ervan uitgegaan dat u akkoord gaat met het delen van uw gegevens met OpenAI volgens hun gebruiksvoorwaarden.

Wat betreft de specifieke vraag over het gebruik van cursusoverzichten als invoer in ChatGPT om ze opnieuw te formuleren voor een beter begrip, kan het verstandig zijn om de cursusinstructeur te vragen of dat in orde is. Zij kunnen toestemming geven of andere oplossingen aanbieden. Als dit mijn cursus was, als ik wist wat er in een typisch cursusoverzicht zit, zou ik waarschijnlijk geen probleem hebben met deze gebruikscasus. Als het resultaat een beter begrip voor een student van het cursusoverzichtmateriaal zou zijn, en hij of zij deze tool voor persoonlijke doeleinden zou gebruiken, zou ik daar helemaal geen probleem mee hebben. 

Auteursrecht en generatieve AI-uitvoer

Sommige mensen proberen auteursrecht te verkrijgen op het materiaal dat door AI wordt gegenereerd, vermoedelijk omdat ze het willen commercialiseren of er geld mee willen verdienen. Momenteel is dit niet mogelijk, zoals blijkt uit de Thaler-zaak. Dit zou kunnen veranderen naarmate het landschap van auteursrecht en generatieve AI zich blijft ontwikkelen.

Ethisch gezien zouden we kunnen nadenken over hoeveel unieke input we hebben bijgedragen aan een werk, en of dat ons auteursrecht op dat werk rechtvaardigt. Momenteel, generatieve AI makers en gebruikers lijken ‘hun taart te willen hebben en die ook op te eten’. Er bestaat onwil om de enorme opslagplaats van auteursrechtelijk beschermde gegevens te erkennen die worden gebruikt om dit soort AI te creëren, en er is actief verzet van makers die financieel compenseren voor het gebruik van hun gegevens. In plaats daarvan beweren bedrijven die generatieve AI maken fair use bepalingen voor de trainingsgegevens. Om je vervolgens om te draaien en auteursrecht te willen toestaan ​​op materiaal dat uit het systeem komt, voelt – gezien de oorsprong van de trainingsgegevens – bijzonder oneerlijk.

Stuur mij uw vragen!

Ik zou liefde om te horen over uw datadilemma's of ethische vragen en dilemma's op het gebied van AI. U kunt mij een bericht sturen via hallo@ethisch uitgelijndai.com of maak contact met mij op LinkedIn. Ik zal alle vragen vertrouwelijk houden en alle potentieel gevoelige informatie verwijderen – dus voel je vrij om de zaken ook op een hoog niveau en anoniem te houden. 

spot_img

Laatste intelligentie

spot_img