제퍼넷 로고

OpenAI, CTO의 Sora 인터뷰 이후 비판에 직면

시간

ChatGPT 및 Sora와 같은 획기적인 도구를 개발한 영향력 있는 인공 지능 연구소인 OpenAI는 최근 최고 기술 책임자(CTO) Mira Murati와의 인터뷰를 통해 논란에 휩싸였습니다.

인터뷰, Wall Street Journal 기자 Joanna Stern이 OpenAI의 최신 이미지, 아니 오히려 비디오 생성 시스템에 초점을 맞춰 진행했습니다. 소라.

AI 모델을 교육하기 위해 저작권이 있는 저작물을 오용할 가능성이 있다는 우려가 있습니다. 투명성의 부족 OpenAI의 데이터 관행과 관련하여.

Sora의 훈련 데이터에 문제가 있습니다.

논란의 중심에는 훈련 데이터 문제가 있다. AI 모델을 훈련하는 데 사용되는 대규모 데이터 세트.

Sora에 활용된 데이터 소스에 대해 물었을 때 Murati는 표준적인 답변을 제공했습니다. 모델은 "공개적으로 사용 가능하고 라이선스가 부여된 데이터".

그러나 추가 조사를 통해 Murati는 이 데이터 세트의 구체적인 세부 사항에 대해 주저함과 불확실성을 드러냈습니다.

이 응답에는 붉은 깃발을 올렸다 예술가, 사진가, 지적재산권 전문가 사이에서 말이죠. AI 이미지 생성 시스템은 방대한 양의 이미지 수집에 크게 의존하며, 그 중 다수는 저작권으로 보호될 수 있습니다. Sora의 훈련 데이터에 대한 명확성이 부족하여 OpenAI가 콘텐츠 제작자의 권리를 적절하게 보호했는지에 대한 의문이 제기됩니다.

OpenAI SORA 훈련 데이터 논란
Sora의 훈련 데이터베이스는 공식 플랫폼에 게시되지 않았습니다. (이미지 크레딧)

나중에 Shutterstock 사용이 인정됨

Murati는 처음에 Shutterstock 이미지가 Sora의 훈련 데이터 세트의 구성 요소인지 여부를 밝히기를 거부했습니다. 인터뷰 후에야 Wall Street Journal이 추가한 각주에서 Murati는 Shutterstock의 이미지 라이브러리 사용을 확인했습니다.

이번 확인은 OpenAI의 공개 입장인 “공개적으로 사용 가능하고 라이선스가 부여된 데이터” 그리고 잠재적으로 문제가 있는 소싱 관행을 은폐하려는 시도를 암시합니다.

Shutterstock과 OpenAI가 결성되었습니다. 파트너십 DALL-E 2 및 Sora와 같은 이미지 생성 모델을 교육하는 데 Shutterstock의 이미지 라이브러리를 사용할 수 있는 OpenAI 권한을 부여합니다.

그 대가로 Shutterstock 기여자(플랫폼에 이미지가 있는 사진 작가 및 아티스트)는 자신의 작업이 이러한 AI 모델 개발에 사용될 때 보상을 받습니다.

PR의 악몽이 펼쳐진다

대부분의 홍보 담당자들은 이 인터뷰를 PR의 걸작으로 여기지 않을 것이라고 말해도 무방합니다.

Murati의 명확성 부족은 OpenAI의 민감한 시기에 발생합니다. 이미 대규모 저작권 소송에 직면해 있음, New York Times가 제출한 중요한 내용을 포함합니다.

대중은 OpenAI가 모델 훈련을 위해 YouTube 동영상을 비밀리에 사용했다는 주장과 같은 관행을 면밀히 조사하고 있습니다. 이전에 The Information에서 보고한 내용입니다.. 예술가부터 정치인까지 이해관계자들이 책임을 요구하는 상황에서 Murati의 회피는 불길을 부채질할 뿐입니다.

OpenAI의 불투명한 접근 방식은 눈부시게 역효과를 낳고 있습니다. Sora 인터뷰를 PR 재앙으로 바꾸는 것.

투명성은 괜히 가장 많이 논의되는 주제가 아닙니다.

이 사건은 AI 세계에서는 진실을 밝히는 것이 가장 중요하다는 중요한 진실을 강조합니다. OpenAI의 당황스러운 대응은 대중의 신뢰를 심각하게 훼손하고 윤리적 관행에 대한 질문을 심화시켰습니다. 소라 논란은 합창단의 성장을 강조한다 AI 산업 내 더 큰 책임 요구.

Murati는 Sora의 훈련 데이터 품종의 세부 사항을 공개하는 것을 꺼려함 불신하고 위험한 선례를 만들다.

예술가, 창작자, 대중의 요구 사항이 명확하지 않으면 윤리적 논쟁과 법적 조치 가능성이 더욱 심화될 것입니다.

이 땅에는 천사가 없다

현재 조사의 대부분은 OpenAI에 직접적으로 적용되지만 기억하는 것이 중요합니다. 그들은 게임의 유일한 플레이어가 아닙니다.

페이스북 AI 연구 LLaMA 모델구글의 쌍둥이 자리 또한 훈련 데이터 소스에 문제가 있다는 주장에 직면했습니다.

OpenAI SORA 훈련 데이터 논란
AI 개발의 투명성 문제는 오랫동안 의제였습니다. (이미지 크레딧)

이는 놀라운 일이 아닙니다. 비즈니스 내부자 보고서 메타가 이미 인정한 사실 인스타그램, 페이스북 게시물을 활용해 AI 모델을 훈련합니다. 추가적으로, 인터넷의 광범위한 범위에 대한 Google의 통제 잠재적인 교육 데이터에 대한 탁월한 액세스를 제공하여 동의 및 저작권에 대한 유사한 윤리적 우려를 제기합니다.

OpenAI의 Sora의 상황은 다음과 같습니다. 더 큰 퍼즐의 한 조각일 뿐이에요. 전체 AI 개발 분야는 데이터 관행과 잠재적인 윤리적 영향에 대한 조사에 직면해 있습니다.


추천 이미지 크레딧: Freepik.

spot_img

최신 인텔리전스

spot_img