제퍼넷 로고

저자, AI NeMo Megatron의 저작권 문제로 Nvidia 고소

시간

세 명의 저자가 AI 플랫폼 NeMo Megatron을 훈련시키기 위한 허가 없이 저작권이 있는 저작물을 사용한 혐의로 칩 제조 대기업인 Nvidia를 고소했습니다.

저자의 주장에 따르면, 2022년에 출시된 Nvidia의 NeMo Megatron-GPT는 "동의, 신용 또는 보상 없이 그들의 책을 복사하고 그립니다."

이제 서기관들은 지난 3년 동안 NeMo를 교육하는 데 사용된 작업을 수행한 사람들에 대해 "불특정 손해"를 요구하고 있습니다.

이는 동의 없이 인터넷에서 스크랩한 정보를 사용하여 모델을 훈련시켰기 때문에 저작권 침해 혐의로 AI 회사를 상대로 제기된 다른 소송 목록에 추가됩니다.

수십만 권의 책이 사용됨

저자 Brian Keene, Abdi Nazemian 및 Stewart O'Nan은 자신의 작업이 일반적인 문자 언어를 시뮬레이션하기 위해 Nvidia의 NeMo AI 플랫폼을 훈련하는 데 사용된 약 196,640권의 책으로 구성된 데이터 세트의 일부라고 주장합니다.

에 따르면 로이터, 그들은 이것이 10월에 철거되기 전이었다고 말했습니다. 저작권 침해. "

저자들은 또한 Nvidia의 게시 중단이 NeMo를 교육할 때 작가의 저작권을 침해했음을 인정하는 신호라고 밝혔습니다.

금요일 샌프란시스코에 제기된 소송에는 킨의 2008년 소설 '고스트 워크(Ghost Walk)', 나제미안이 2019년 집필한 '러브 스토리처럼(Like a Love Story)', 오넌의 2007년 소설 '라스트 나이트 랍스터(Last Night at the Lobster)'가 포함된다.

"훈련 중에 LLM은 훈련 데이터 세트의 각 텍스트 작업을 복사 및 수집하고 여기에서 보호된 표현을 추출합니다." 읽기 불만사항의 일부.

에 따르면 폭스 비즈니스, 저자는 소송에서 해당 책이 "Books3"이라는 책 모음이 포함된 The Pile이라는 데이터에 있다고 밝혔습니다. 그러나 Nvidia는 NeMo Megatron AI 모델을 "The Pile과 세 권의 책에서" 훈련했다고 인정했습니다.

더미의 책 3

에 따르면 PCMag, NeMo Megatron 훈련에 사용된 The Pile은 800GB의 데이터로 구성됩니다. 여기에는 저자의 소송에 명시된 대로 108GB의 책이 포함됩니다.

도서 구성 요소는 'Bibliotik'에 관한 3권 이상의 도서가 포함된 'Books196,000'으로 불리며, 여기에는 세 명의 저자의 도서가 포함됩니다.

저자가 언급한 대로 Pile's Books3는 다음 목록에 등재되었습니다. 포옹하는 얼굴 작년 10월 데이터 세트가 "신고된 저작권 침해로 인해 존재하지 않으며 더 이상 액세스할 수 없습니다"라는 메시지와 함께 제거될 때까지 말입니다.

또한 읽기 : LLM이 노트북에 등장: Nvidia와 HP의 CEO, AI PC 축하

작가들의 소송 증가

그러나 Nvidia 대변인은 칩 제조업체가 법률과 규정을 준수하고 있다고 말했습니다.

대변인은 이메일을 통해 PCMag에 “우리는 모든 콘텐츠 제작자의 권리를 존중하며 저작권법을 완벽하게 준수하여 NeMo를 만들었다고 믿습니다.”라고 말했습니다.

최근 소송으로 Nvidia는 점점 늘어나는 작가와 출판사 소송 목록에 추가되었습니다.

Nvidia는 자사의 AI 플랫폼 NeMo를 "생성 AI를 채택하는 빠르고 저렴한 방법"이라고 홍보했습니다. 이 기술은 산문을 만들고, 가사를 쓰고, 이미지나 비디오를 만들고, 시를 쓸 수 있는 기술입니다.

소송을 벌이는 AI 회사는 엔비디아뿐만이 아니다. ChatGPT 메이커 OpenAI 그리고 그 후원자 Microsoft는 보류 중입니다. 저작권 소송 뉴욕 타임즈.

그러나 그것이 전부는 아닙니다. 최근에는 예술가들도 생성 AI 이미지 제작자에 대한 우려를 제기하며 나섰습니다. 중도 또한 "그들의 독특한 스타일을 사용하여 동의 없이 작품에서 끌어낸 결과물을 만들어 비인간적이고 무례하다고 부릅니다."

spot_img

최신 인텔리전스

spot_img