Zephyrnet-logotyp

Fråga en dataetiker: Vilken data är OK att använda för att uppmana ChatGPT? – DATAVERSITET

Datum:

Miljontals människor använder ChatGPT regelbundet för att hjälpa dem i både personlig och professionell kapacitet. Månadens fråga fokuserar på data som används för att uppmana ChatGPT. 

Vår läsare, som delade att de är en ESL-talare, skulle vilja veta om det är etiskt att låta ChatGPT skapa sammanfattningar av information (speciellt kursöversikter) för att hjälpa dem. Den sammanfattade informationen skulle endast användas för personliga ändamål och skulle inte delas online med andra personer. Om vi ​​går ut i en mer allmän situation kan vi fråga...

Vilken data är OK att använda för att fråga ChatGPT?

Två små varningar

Innan du kommer till frågan är det viktigt att påpeka språkens maktdynamik. Det finns en enorm mängd privilegier som motsvarar att prata engelska. Så mycket teknik och vetenskapligt arbete är engelskcentrerat och det kan sätta människor som inte talar engelska som sitt första språk i en jämförelsevis underläge. Kontexten av att vilja använda ett verktyg för att "jämna spelplanen" måste ta hänsyn till etiska överväganden. Här är en ESL-talares erfarenhet av använder ChatGPT på ett sätt som de har funnit fördelaktigt.

Det andra jag ska nämna är att jag inte är advokat och att den här kolumnen inte är juridisk rådgivning. Informationen i detta svar är endast avsedd för utbildningsändamål. Frågan om upphovsrätt och generativ AI är ett område under utveckling och alla som har specifika frågor bör söka råd från en jurist.

Upphovsrättsmaterial och ChatGPT-meddelanden

Generellt sett bör du inte använda något material som gör intrång i upphovsrätten i din prompt utan lämpligt tillstånd. Detta är väldigt tydligt i ChatGPT:s Användarvillkor, vilken stat:

"Du får inte använda våra tjänster för någon olaglig, skadlig eller kränkande aktivitet. Du får till exempel inte...använda våra tjänster på ett sätt som gör intrång, förskingrar eller kränker någons rättigheter."

Om du till exempel skulle klippa ut och klistra in en del av ett upphovsrättsskyddat verk från en artikel som publicerats på nätet, och du bad ChatGPT att sammanfatta eller omformulera informationen, skulle du göra intrång i upphovsrätten och du skulle bryta dig mot ChatGPT:s användarvillkor . Om du ställde en fråga till ChatGPT och du tillhandahöll ett stycke material från ett upphovsrättsskyddat verk som bakgrundskontext i din uppmaning, skulle du potentiellt göra intrång i upphovsrätten. 

Detta är viktigt att veta eftersom vi i vissa inställningar kan använda upphovsrättsskyddat material som en del av tillåten användning, med lämpliga tillskrivningar. Akademin bygger på denna bestämmelse! Att använda upphovsrättsskyddat material i din PROMPT är dock inte nödvändigtvis samma sak. Som forskaren Anita Toh noterar:

"Landskapet av upphovsrättslagar och skälig användning i relation till generativa AI-verktyg utvecklas fortfarande. Medan tidigare forskare kunde lita på fair use-doktrinen för användningen av upphovsrättsskyddat material i sitt forskningsarbete, introducerar tillgängligheten av generativa AI-verktyg nu ytterligare ett lager av komplexitet. Detta är särskilt relevant när AI själv kan lagra eller använda data för att förfina sina egna algoritmer, vilket potentiellt kan betraktas som ett brott mot klausulen om icke-kommersiell användning i doktrinen om skälig användning." (SRHE)

Jag kan citera Anita Toh i den här artikeln utan att bryta mot upphovsrätten på grund av skälig användning och korrekt attribution. Jag kan dock inte ta det citatet och använda det i ChatGPT som en del av en uppmaning eftersom det potentiellt skulle vara en kränkning av hennes arbete, som hon påpekar. 

Om du vill stanna kvar, lagligt och etiskt, be inte ChatGPT att sammanfatta upphovsrättsskyddat arbete som du inte har lämpligt tillstånd att använda för.

Personlig eller konfidentiell data 

En annan typ av data som du inte bör använda för att fråga ChatGPT är personlig information, såvida du inte har lämpliga medgivanden, meddelanden och avtal på plats. Detta täcks också av ChatGPT:s användarvillkor. Personuppgifter omfattar en rad information som kan identifiera en person. Det kan innehålla namn, adresser och annan identifieringsinformation. 

Dessutom bör konfidentiell information inte användas i en prompt. Det kan vara uppgifter som du har en yrkesmässig eller personlig skyldighet att inte avslöja. Det kan vara information från din arbetsgivare eller en kund, eller så kan det helt enkelt vara information som delas av en vän eller bekant som de har bett dig att inte dela med någon. Använd inte den informationen i en prompt! 

Kom ihåg att ChatGPT-meddelanden involverar datadelning och att data har potential att hamna på platser utanför din kontroll.

Men är inte ChatGPT byggd på upphovsrättsskyddad träningsdata? 

Det här är en mångmiljonfråga om huruvida regler för tillåten användning gäller i samband med träningsdata. Det är i fokus för stämningar av författare som Sarah Silverman och publikationer som New York Times. Detta är inget som du som slutanvändare kommer att kunna kontrollera och de juridiska frågorna kommer att behöva tid för att avgöras. Men för närvarande framgår det tydligt av villkoren som publicerats av OpenAI att du som användare bryter mot deras villkor om du gör intrång eller bryter mot någon annans upphovsrätt i din prompt.

Vad är OK att använda i en prompt?

Du bör formulera frågor eller instruktioner för en uppmaning med dina egna ord. Du kan också använda material i din prompt som du äger upphovsrätten till eller har lämpliga avtalsenliga tillstånd att använda. Jag kan till exempel ta ett manus jag har skrivit och be ChatGPT att skriva om det. När det gäller en ESL-högtalare kan du använda ditt eget arbete eller din egen formulering i prompten och be ChatGPT att hjälpa dig att skriva om eller omformulera det. Detta förutsätter att du är med och delar din data med OpenAI enligt deras användarvillkor.

När det gäller den specifika frågan om att använda kursöversikter som input i ChatGPT för att få dem omformulerade för bättre förståelse, kan det vara klokt att fråga kursläraren om det är OK. De kan ge tillstånd eller erbjuda andra lösningar. Om det här var min kurs, med att veta vad som ingår i en typisk kursöversikt, skulle jag förmodligen inte ha några problem med detta användningsfall. Om resultatet var en bättre förståelse för en student av kursens dispositionsmaterial, och de använde det här verktyget för personliga ändamål, skulle jag inte ha några problem med det alls. 

Copyright och generativa AI-utgångar

Vissa människor försöker skydda materialet som genereras av AI, förmodligen för att de kanske vill kommersialisera eller tjäna pengar på det. För närvarande är detta inte något som är möjligt, vilket illustreras av Thaler fall. Detta kan förändras i takt med att landskapet för upphovsrätt och generativ AI fortsätter att utvecklas.

Etiskt sett kan vi tänka på hur mycket unik input vi bidragit med till ett verk, och om det garanterar vår upphovsrätt till det verket eller inte. För närvarande, generativ AI Tillverkare och användare verkar vilja "ta sin kaka och äta den också." Det finns en ovilja att erkänna det stora arkivet av upphovsrättsskyddad data som används för att skapa denna typ av AI och aktivt motstånd från ekonomiskt kompenserande skapare för användningen av deras data. Istället hävdar företag som tillverkar generativ AI skäligt bruk bestämmelser för utbildningsdata. Att sedan vända om och vilja tillåta upphovsrätt för material som kommer ut ur systemet känns särskilt orättvist – med tanke på utbildningsdatans ursprung.

Skicka mig dina frågor!

Jag skulle älskar för att höra om dina datadilemman eller AI-etiska frågor och problem. Du kan skicka mig ett meddelande på hello@ethicallyalignedai.com eller kontakta mig på LinkedIn. Jag kommer att hålla alla förfrågningar konfidentiella och ta bort all potentiellt känslig information – så håll gärna saker på hög nivå och anonyma också. 

plats_img

Senaste intelligens

plats_img