Logo Zephyrnet

New York Times kiện OpenAI, Microsoft về dữ liệu đào tạo

Ngày:

Tờ New York Times đã kiện Microsoft và OpenAI, cho rằng bộ đôi này đã vi phạm bản quyền của tờ báo khi sử dụng trái phép các bài viết của họ để xây dựng ChatGPT và các mô hình tương tự. Đây là cơ quan truyền thông lớn đầu tiên của Mỹ lôi cặp công nghệ này ra tòa về việc sử dụng các câu chuyện trong dữ liệu đào tạo.

Như với những bộ đồ tương tự – bao gồm hoạt động được thực hiện bởi nhiều nghệ sĩ và người sáng tạo khác nhau, chẳng hạn như Sarah Silverman – NYT khiếu nại [PDF] xoay quanh việc sử dụng tài liệu có bản quyền – trong trường hợp này là từ The Times – trong việc đào tạo các mô hình ngôn ngữ lớn (LLM) đằng sau nhiều chatbot Microsoft và OpenAI cũng như các dịch vụ AI tổng hợp.

Khiếu nại chỉ trích Microsoft, không chỉ vì khoản đầu tư mà họ đã thực hiện vào OpenAI mà còn đối với các trợ lý như Microsoft 365 Copilot và Bing Chat mà khiếu nại cáo buộc: “Nội dung của Display Times trong đầu ra tổng quát theo ít nhất hai cách: (1) bằng cách hiển thị các bản sao hoặc dẫn xuất 'được ghi nhớ' của các tác phẩm của Times được lấy từ chính các mô hình và (2) bằng cách hiển thị các kết quả tìm kiếm tổng hợp về cơ bản giống với các tác phẩm của Times được tạo từ các bản sao được lưu trữ trong chỉ mục tìm kiếm của Bing.”

Tờ báo khá khó chịu khi “hàng triệu” bài báo có bản quyền của họ đã được thu thập để tạo thành một phần mô hình của Microsoft và OpenAI mà không được phép, đồng thời các mạng thần kinh này sẽ phục hồi lại công việc đó theo yêu cầu của người dùng mà không được phép.

Trong đơn khiếu nại của mình, NYT đưa ra các ví dụ mà họ cáo buộc chứng minh ChatGPT đã được đào tạo về nội dung của nó. Hơn nữa, một câu hỏi né tránh tường phí đơn giản đối với ChatGPT dường như dẫn đến các phản hồi chứa văn bản có bản quyền.

Và chính việc né tránh tường phí của việc thu thập nội dung của OpenAI đã thu hút sự giám sát đặc biệt. Theo đơn khiếu nại, tờ báo đã bắt đầu giấu công việc của mình sau một bức tường phí từ 12 năm trước và tính đến quý 2023 năm 10.1, đã đưa ra yêu cầu cho 15 triệu người đăng ký bản in và bản kỹ thuật số. Nó đặt mục tiêu tăng con số đó lên 2027 triệu vào cuối năm XNUMX.

Độc giả không thường xuyên cũng được phục vụ với quyền truy cập miễn phí vào một số bài báo có giới hạn trước khi yêu cầu đăng ký. NYT ước tính họ thu hút 50 đến 100 triệu người dùng mỗi tuần với cách tiếp cận như vậy, đồng thời quảng cáo sẽ lấp đầy kho bạc của họ.

Đơn khiếu nại giải thích: “The Times phụ thuộc vào các quyền độc quyền về sao chép, phóng tác, xuất bản, trình diễn và hiển thị theo luật bản quyền để chống lại các thế lực này. The Times đã đăng ký bản quyền ấn bản in hàng ngày của mình trong hơn 100 năm, duy trì tường phí và đã triển khai các điều khoản dịch vụ đặt ra giới hạn cho việc sao chép và sử dụng nội dung của tờ báo. Để sử dụng nội dung của Times cho mục đích thương mại, trước tiên một bên phải liên hệ với The Times về thỏa thuận cấp phép.”

Tuy nhiên, để thu hút lưu lượng truy cập đến trang web của mình, NYT cũng cho phép các công cụ tìm kiếm truy cập và lập chỉ mục nội dung của nó. “Nội tại của việc trao đổi giá trị này là ý tưởng rằng các công cụ tìm kiếm sẽ hướng người dùng đến các trang web và ứng dụng di động của The Times, thay vì khai thác nội dung của The Times để giữ người dùng trong hệ sinh thái tìm kiếm của riêng họ.”

Để sử dụng nội dung của Times cho mục đích thương mại, trước tiên một bên phải liên hệ với The Times về thỏa thuận cấp phép

The Times nói thêm rằng họ chưa bao giờ cho phép bất kỳ ai – kể cả Microsoft và OpenAI – sử dụng nội dung của nó cho các mục đích sáng tạo AI. Và đó là sự chà xát. Theo tờ báo, họ đã liên hệ với Microsoft và OpenAI vào tháng 2023 năm XNUMX để giải quyết vấn đề một cách thân thiện. Nó tuyên bố thẳng thừng: “Những nỗ lực này đã không tạo ra được giải pháp.”

Và vì vậy, chúng tôi nhận được đơn khiếu nại cáo buộc “một mô hình kinh doanh dựa trên hành vi vi phạm bản quyền hàng loạt” và trình bày chi tiết về hành trình của OpenAI từ những ngày đầu thành lập với tư cách là một “công ty nghiên cứu trí tuệ nhân tạo phi lợi nhuận” vào năm 2015 cho đến khi trở thành gã khổng lồ như ngày nay.

Theo đơn khiếu nại: “Bất chấp những hứa hẹn ban đầu về lòng vị tha, OpenAI đã nhanh chóng trở thành một doanh nghiệp vì lợi nhuận trị giá hàng tỷ đô la, phần lớn được xây dựng dựa trên việc khai thác trái phép các tác phẩm có bản quyền của The Times và những người khác.”

Vậy lam gi? Không có gì đáng ngạc nhiên khi NYT đang yêu cầu bồi thường thiệt hại. Nó cũng yêu cầu một phiên tòa xét xử của bồi thẩm đoàn và muốn tòa án ra lệnh tiêu hủy “tất cả các mô hình GPT hoặc LLM khác và bộ đào tạo kết hợp các tác phẩm của Times”.

Đầu tháng này, Axel Springer và OpenAI đã công bố một kế hoạch để cung cấp các bản tóm tắt nội dung trước đây – bao gồm cả nội dung trả phí – từ các sản phẩm của họ, bao gồm cả ChatGPT. Kế hoạch là đảm bảo câu trả lời cho các truy vấn của người dùng bao gồm ghi công và liên kết đến toàn bộ bài viết.

Không rõ thỏa thuận này trị giá bao nhiêu. Theo Financial Times, một khoản tiền tám con số có liên quan. Như đã lưu ý trong đơn khiếu nại của mình, NYT cũng đã có các cuộc thảo luận, nhưng rõ ràng kết quả không đạt yêu cầu. ®

tại chỗ_img

Tin tức mới nhất

tại chỗ_img