Logo Zephyrnet

Các tác giả kiện Nvidia về bản quyền trong AI NeMo Megatron

Ngày:

Ba tác giả đã kiện gã khổng lồ sản xuất chip – Nvidia vì bị cáo buộc sử dụng các tác phẩm có bản quyền của họ mà không được phép để đào tạo nền tảng AI NeMo Megatron của họ.

Theo lập luận của các tác giả, NeMo Megatron-GPT của Nvidia, phát hành vào năm 2022 “sao chép và rút ra từ sách của họ mà không có sự đồng ý, ghi công hoặc bồi thường”.

Giờ đây, những người ghi chép đang tìm kiếm “những thiệt hại không xác định” đối với những người có công việc được sử dụng để đào tạo NeMo trong ba năm qua.

Điều này bổ sung vào danh sách các vụ kiện khác chống lại các công ty AI về cáo buộc vi phạm bản quyền, khi họ đào tạo người mẫu của mình bằng cách sử dụng thông tin bị loại bỏ trên Internet mà không có sự đồng ý.

Hàng trăm ngàn cuốn sách được sử dụng

Các tác giả Brian Keene, Abdi Nazemian và Stewart O'Nan khẳng định tác phẩm của họ là một phần của bộ dữ liệu gồm khoảng 196,640 cuốn sách được sử dụng để đào tạo nền tảng NeMo AI của Nvidia để mô phỏng ngôn ngữ viết thông thường.

Theo ReutersHọ nói rằng đó là trước khi chúng bị gỡ xuống vào tháng 10 “do được báo cáo vi phạm bản quyền".

Trong hồ sơ của mình, các tác giả cũng chỉ ra việc Nvidia gỡ xuống là một dấu hiệu thừa nhận họ đã vi phạm bản quyền của người viết khi đào tạo NeMo.

Vụ kiện được đệ trình vào thứ Sáu tại San Francisco bao gồm cuốn tiểu thuyết năm 2008 của Keene có tên “Ghost Walk”, “Like a Love Story” do Nazemian viết năm 2019 và tiểu thuyết ngắn “Last Night at the Lobster” năm 2007 của O'Nan.

“Trong quá trình đào tạo, LLM sao chép và nhập từng tác phẩm văn bản vào tập dữ liệu huấn luyện và trích xuất biểu thức được bảo vệ từ đó,” đọc một phần của khiếu nại.

Theo Fox Business, các tác giả cho biết trong vụ kiện của họ rằng những cuốn sách này nằm trong một dữ liệu có tên The Pile “chứa một bộ sưu tập sách có tên” Books3.” Tuy nhiên, Nvidia đã thừa nhận đã đào tạo các mô hình AI NeMo Megatron của mình “về The Pile và ba cuốn sách”.

Cuốn sách của Pile3

Theo PCMag, The Pile – được sử dụng để đào tạo NeMo Megatron bao gồm 800GB dữ liệu. Điều này bao gồm 108GB sách, như đã nêu trong vụ kiện của tác giả.

Thành phần sách của nó được mệnh danh là “Books3” với hơn 196,000 cuốn sách trên “Bibliotik” và bao gồm cả sách của ba tác giả.

Như các tác giả đã nêu, Pile's Books3 đã được liệt kê trên Ôm mặt cho đến tháng 10 năm ngoái khi tập dữ liệu bị xóa với thông báo “không còn tồn tại và không thể truy cập được do vi phạm bản quyền được báo cáo”.

Ngoài ra đọc: LLM đến trên máy tính xách tay: CEO của Nvidia và HP tôn vinh PC AI

Sự kiện tụng gia tăng của các nhà văn

Tuy nhiên, người phát ngôn của Nvidia cho biết nhà sản xuất chip này đã tuân thủ luật pháp và quy định.

Người phát ngôn nói với PCMag qua email: “Chúng tôi tôn trọng quyền của tất cả những người sáng tạo nội dung và tin rằng chúng tôi đã tạo ra NeMo tuân thủ đầy đủ luật bản quyền”.

Vụ kiện mới nhất bổ sung Nvidia vào danh sách các vụ kiện tụng ngày càng tăng của các nhà văn và nhà xuất bản.

Nvidia đã quảng cáo nền tảng AI NeMo của mình là “cách nhanh chóng và giá cả phải chăng để áp dụng Generative AI”, công nghệ có thể tạo văn xuôi, soạn lời bài hát, tạo hình ảnh hoặc video và viết thơ.

Nvidia không phải là công ty AI duy nhất phải đối mặt với các vụ kiện. Nhà sản xuất ChatGPT OpenAI và những người ủng hộ nó là Microsoft đang chờ xử lý vụ kiện bản quyền của New York Times.

Nhưng đó không phải là tất cả. Gần đây, các nghệ sĩ cũng đã lên tiếng nêu lên mối lo ngại rằng người tạo hình ảnh AI có tính sáng tạo midjourney cũng đang sử dụng “phong cách độc đáo của họ để tạo ra kết quả đầu ra từ công việc của họ mà không có sự đồng ý của họ, gọi đó là hành vi mất nhân tính và thiếu tôn trọng”.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img