Logo Zephyrnet

Đã báo cáo thỏa thuận Reddit trị giá 60 triệu đô la để đào tạo các mô hình AI bằng dữ liệu người dùng

Ngày:

Reddit được cho là đã ký một thỏa thuận trị giá 60 triệu USD với một AI biz giấu tên để chuyển giao các cuộc trò chuyện của người dùng cho hoạt động đào tạo người mẫu.

Thỏa thuận này được đưa ra khi Reddit muốn tăng cường sự quan tâm đến đợt IPO sắp tới của mình. Reddit báo cáo đã nói với các nhà đầu tư tiềm năng về hợp đồng trị giá 60 triệu đô la vào đầu năm nay và chỉ ra rằng các nhà điều hành của nó có thể lặp lại loại thỏa thuận chia sẻ nội dung cho đào tạo người mẫu này trong tương lai.

Bloomberg, trích dẫn “những người quen thuộc với vấn đề này”, lưu ý rằng cả thông tin chi tiết về lần ra mắt thị trường chứng khoán và giao dịch AI đều có thể thay đổi và niêm yết dự kiến bây giờ có thể xảy ra ngay sau tháng Ba. Reddit đã không trả lời ngay lập tức Đăng kýnhững thắc mắc của.

Mặt khác, người dùng trang web có rất nhiều điều để nói về thương vụ được đồn đại trị giá 60 triệu USD. Các nhận xét dao động từ “Reddit đang hỏi CÁCH quá ít" đến tại sao lại có người trả tiền hàng chục triệu đô la cho 'shitposts' và "tác phẩm nghệ thuật kinh dị ít người biết đến".

Nhiều áp phích hoài nghi hơn gợi lại kế hoạch của Reddit tính phí truy cập API, dẫn đến một cuộc nổi dậy hạn chế của người dùng và một số diễn đàn chuyển sang chế độ riêng tư hoặc đóng cửa. Ngoài việc buộc các ứng dụng của bên thứ ba phải trả tiền để tương tác với nền tảng – đảm bảo Reddit kiếm tiền trực tiếp từ các ứng dụng bên ngoài hoặc từ quảng cáo được hiển thị trong các dịch vụ của chính họ – mức giá mới là một cách để nạp tiền vào Các nhà sản xuất mô hình AI đang thu thập dữ liệu đào tạo trên trang web.

Mọi người đều biết rằng các bài đăng và/hoặc liên kết được gửi trên Reddit đã được sử dụng để đào tạo mạng lưới thần kinh, bao gồm GPT-2 của OpenAI, trong quá khứ.

“Thật tốt khi biết rằng việc kiểm soát API của Reddit không bao giờ là vì họ muốn bảo vệ dữ liệu của bạn khỏi việc sử dụng AI,” một người dùng lưu ý. “Họ chỉ bảo vệ nó khỏi việc sử dụng AI miễn phí. Chào mừng đến với địa ngục cyberpunk buồn tẻ nhất.”

Reddit sẽ không phải là trang đầu tiên cung cấp dữ liệu đào tạo do người dùng tạo cho người chơi AI và có lẽ việc chia sẻ đó được bao gồm trong các điều khoản và điều kiện sử dụng. Trong khi chống lại yêu cầu của vi phạm bản quyền liên quan đến việc sử dụng sách và báo chí được xuất bản trong việc đào tạo gia đình siêu mẫu của mình, OpenAI đã thỏa thuận cấp phép được bảo đảm với Associated Press và Axel Springer, và là báo cáo trong các cuộc đàm phán với CNN, Fox và Time một cách rõ ràng về việc sử dụng các bài viết của các tổ chức truyền thông này cho mục đích đào tạo.

Tuy nhiên, trong khi Reddit là một thời điểm tuyệt vời để đào sâu vào những hố thỏ ít người biết đến về những thứ như bánh mì kẹp phô mai nướngcá la hét, đó vẫn là một khối lượng lớn quan điểm và trải nghiệm cá nhân có thể phản ánh thực tế hoặc không. Chúng tôi không chắc mình sẽ sử dụng tất cả những thứ đó để xây dựng một mô hình ngôn ngữ dứt khoát.

Là một người dùng Reddit đặt nó: “Sẽ là một AI ngu ngốc.” ®

tại chỗ_img

Tin tức mới nhất

tại chỗ_img