제퍼넷 로고

데이터 윤리학자에게 물어보세요: ChatGPT를 알리는 데 사용할 수 있는 데이터는 무엇인가요? – 데이터 다양성

시간

수백만 명의 사람들이 정기적으로 ChatGPT를 사용하여 개인적 및 직업적 역량을 모두 지원하고 있습니다. 이번 달의 질문은 ChatGPT를 유도하는 데 사용되는 데이터에 중점을 둡니다. 

자신이 ESL 연사라고 공유한 독자는 ChatGPT가 정보 요약(특히 코스 개요)을 작성하여 도움을 주는 것이 윤리적인지 알고 싶습니다. 요약된 정보는 개인적인 목적으로만 사용되며 다른 사람과 온라인으로 공유되지 않습니다. 이것을 좀 더 일반적인 상황으로 확장하면 다음과 같이 질문할 수 있습니다.

ChatGPT 메시지를 표시하는 데 사용할 수 있는 데이터는 무엇입니까?

두 가지 작은 주의 사항

질문에 답하기 전에 언어의 힘의 역학을 지적하는 것이 중요합니다. 영어를 말하는 것에 상응하는 엄청난 양의 특권이 있습니다. 많은 기술과 과학 연구는 영어 중심적이므로 영어를 모국어로 사용하지 않는 사람들을 상대적으로 불리하게 만들 수 있습니다. "경쟁의 장을 평준화"하는 데 도움이 되는 도구를 사용하려는 맥락은 윤리적 심의를 고려해야 합니다. 다음은 한 ESL 강사의 경험입니다. ChatGPT 사용 그들이 유익하다고 생각하는 방식으로.

제가 언급할 또 다른 점은 저는 변호사가 아니며 이 칼럼은 법적 조언이 아니라는 것입니다. 이 답변에 제공된 정보는 교육 목적으로만 제공됩니다. 저작권 및 생성 AI 문제는 진화하는 영역이므로 특정 질문이 있는 사람은 누구나 법률 전문가의 조언을 구해야 합니다.

저작권 자료 및 ChatGPT 프롬프트

일반적으로 적절한 허가 없이 메시지에 저작권을 침해하는 자료를 사용해서는 안 됩니다. 이것은 ChatGPT에서 매우 분명합니다. 이용 약관, 어떤 주:

“귀하는 불법적이거나 유해하거나 모욕적인 활동을 위해 당사 서비스를 사용할 수 없습니다. 예를 들어, 귀하는 다른 사람의 권리를 침해, 유용 또는 위반하는 방식으로 당사 서비스를 사용할 수 없습니다.”

예를 들어, 온라인에 게시된 기사에서 저작권이 있는 작품의 일부를 잘라서 붙여넣고 ChatGPT에 정보를 요약하거나 다시 작성하도록 요청한 경우 저작권을 침해하는 것이며 ChatGPT의 이용 약관에 위배됩니다. . ChatGPT에 질문을 하고 메시지의 배경 맥락으로 저작권이 있는 작품의 자료 단락을 제공했다면 잠재적으로 저작권을 침해하게 될 수 있습니다. 

일부 설정에서는 저작권 보호 자료를 적절한 저작자 표시와 함께 공정 사용의 일부로 사용할 수 있으므로 이를 아는 것이 중요합니다. 학계는 이 조항 위에 세워졌습니다! 그러나 PROMPT에 저작권이 있는 자료를 사용하는 것이 반드시 동일한 것은 아닙니다. 연구원 Anita Toh는 다음과 같이 지적합니다.

“생성 AI 도구와 관련된 저작권법 및 공정 사용 환경은 여전히 ​​진화하고 있습니다. 이전에는 연구자들이 연구 작업에서 저작권이 있는 자료를 사용하기 위해 공정 사용 원칙에 의존할 수 있었지만, 이제 생성 AI 도구의 가용성으로 인해 복잡성이 더욱 가중됩니다. 이는 AI 자체가 자체 알고리즘을 개선하기 위해 데이터를 저장하거나 사용할 수 있는 경우 특히 관련이 있으며, 이는 잠재적으로 공정 사용 원칙의 비상업적 사용 조항을 위반하는 것으로 간주될 수 있습니다.” (SRHE)

이 기사에서는 공정한 사용과 적절한 귀속으로 인해 저작권을 위반하지 않고 Anita Toh의 말을 인용할 수 있습니다. 그러나 나는 그 인용문을 ChatGPT에서 프롬프트의 일부로 사용할 수 없습니다. 왜냐하면 그녀가 지적한 것처럼 잠재적으로 그녀의 작업을 위반할 수 있기 때문입니다. 

법적으로나 윤리적으로 입장을 유지하려면 ChatGPT에 적절한 사용 권한이 없는 저작물을 요약해 달라고 요청하지 마세요.

개인 또는 기밀 데이터 

ChatGPT를 프롬프트하는 데 사용해서는 안 되는 또 다른 종류의 데이터는 다음과 같습니다. 개인 정보, 귀하가 적절한 동의, 통지 및 계약을 체결하지 않은 경우. 이는 ChatGPT의 이용 약관에도 적용됩니다. 개인 데이터에는 개인을 식별할 수 있는 다양한 정보가 포함됩니다. 여기에는 이름, 주소 및 기타 식별 정보가 포함될 수 있습니다. 

또한 프롬프트에서 기밀 데이터를 사용해서는 안 됩니다. 이는 공개하지 말아야 할 직업적 또는 개인적 의무가 있는 데이터일 수 있습니다. 이는 고용주나 고객이 제공한 정보일 수도 있고, 단순히 친구나 지인이 누구와도 공유하지 말라고 요청한 공유 정보일 수도 있습니다. 프롬프트에서 해당 정보를 사용하지 마십시오! 

ChatGPT 프롬프트에는 데이터 공유가 포함되며 데이터가 통제할 수 없는 위치에 있을 가능성이 있다는 점을 기억하세요.

하지만 ChatGPT는 저작권이 있는 교육 데이터를 기반으로 구축되지 않았나요? 

이는 교육 데이터의 맥락에서 공정 사용 규칙이 적용되는지 여부에 대한 수백만 달러 규모의 질문입니다. 다음과 같은 작가의 소송의 초점은 다음과 같습니다. 사라 실버 그리고 다음과 같은 출판물 뉴욕 타임스. 이는 최종 사용자로서 귀하가 통제할 수 있는 사항이 아니며 법적 문제를 해결하려면 시간이 필요합니다. 그러나 현재로서는 OpenAI가 게시한 약관을 보면 사용자로서 프롬프트에서 다른 사람의 저작권을 침해하거나 위반하는 경우 OpenAI의 약관을 위반하는 것이 분명합니다.

프롬프트에 사용해도 괜찮은 것은 무엇입니까?

프롬프트에 대한 질문이나 지침을 자신의 말로 표현해야 합니다. 또한 귀하가 저작권을 소유하고 있거나 적절한 계약상 사용 허가를 받은 자료를 메시지에 사용할 수도 있습니다. 예를 들어, 내가 작성한 스크립트를 ChatGPT에 다시 작성하도록 요청할 수 있습니다. ESL 연사의 경우 프롬프트에서 자신의 작업이나 문구를 사용하고 ChatGPT에 이를 다시 작성하거나 바꿔 달라고 도움을 요청할 수 있습니다. 이는 귀하가 OpenAI 이용 약관에 따라 귀하의 데이터를 OpenAI와 공유하고 있다고 가정합니다.

더 나은 이해를 위해 코스 개요를 ChatGPT에 대한 입력으로 사용하여 다시 설명하도록 하는 것에 대한 구체적인 질문과 관련하여 코스 강사에게 그것이 괜찮은지 물어보는 것이 현명할 수 있습니다. 그들은 권한을 부여하거나 다른 솔루션을 제공할 수 있습니다. 이것이 내 강좌라면 일반적인 강좌 개요에 무엇이 들어가는지 알고 있으므로 이 사용 사례에 문제가 없을 것입니다. 결과적으로 학생이 코스 개요 자료를 더 잘 이해하고 이 도구를 개인적인 목적으로 사용했다면 전혀 문제가 되지 않았을 것입니다. 

저작권 및 생성적 AI 출력

일부 사람들은 AI가 생성한 자료에 대한 저작권을 얻으려고 합니다. 아마도 AI를 상업화하거나 수익화하기를 원하기 때문일 것입니다. 현재 이것은 가능한 일이 아닙니다. 탈러 사례. 저작권 및 생성 AI 환경이 계속 발전함에 따라 이러한 상황은 바뀔 수 있습니다.

윤리적으로 우리는 우리가 작품에 얼마나 많은 고유한 입력을 기여했는지, 그리고 그것이 해당 작품에 대한 저작권을 보장하는지 여부를 생각할 수 있습니다. 현재, 생성 적 AI 제작자와 사용자는 "케이크를 먹고도 먹고 싶어"하는 것 같습니다. 이러한 유형의 AI를 만드는 데 사용된 방대한 저작권 데이터 저장소를 인정하는 것을 꺼려하며, 데이터 사용에 대해 재정적으로 보상하는 제작자의 적극적인 저항이 있습니다. 대신 생성 AI를 만드는 회사들은 다음과 같이 주장하고 있습니다. 공정 이용 훈련 데이터에 대한 규정. 그런 다음 돌아서서 시스템에서 나오는 자료에 대한 저작권을 허용하려는 것은 훈련 데이터의 출처를 고려할 때 특히 불공평하다고 느낍니다.

질문을 보내주세요!

나는 것 애정 데이터 딜레마나 AI 윤리 관련 질문 및 난관에 대해 들어보세요. 다음 주소로 나에게 메모를 보내실 수 있습니다. hello@ethicallyalignedai.com 또는 에 나와 연결 링크드인. 모든 문의 사항은 기밀로 유지하고 잠재적으로 민감한 정보는 모두 제거하겠습니다. 따라서 높은 수준과 익명성을 유지해 주시기 바랍니다. 

spot_img

최신 인텔리전스

spot_img