Logo Zephyrnet

XAI do Elon Musk dẫn đầu tiết lộ Grok 1.5V có tính năng xử lý hình ảnh

Ngày:


Công ty trí tuệ nhân tạo (AI) xAI của Elon Musk chuẩn bị giới thiệu một phiên bản mô hình ngôn ngữ Grok có thể xử lý hình ảnh, như công ty đã chia sẻ trong tuần này.

Trong một nhấn phát hành chia sẻ trên trang web của mình vào thứ Sáu, xAI đã công bố Grok 1.5V, hay Grok 1.5 Vision, mô hình AI đầu tiên xử lý video cùng với việc xử lý văn bản. Tin tức này có nghĩa là Grok hiện có thể xử lý thông tin trực quan như tài liệu, ảnh, sơ đồ, v.v., đồng thời giúp mô hình này cạnh tranh với các nền tảng đa phương thức khác.

“Giới thiệu Grok-1.5V, mẫu đa phương thức thế hệ đầu tiên của chúng tôi,” xAI viết trong bản phát hành. “Ngoài khả năng văn bản mạnh mẽ, Grok giờ đây có thể xử lý nhiều loại thông tin trực quan, bao gồm tài liệu, sơ đồ, biểu đồ, ảnh chụp màn hình và ảnh chụp. Grok-1.5V sẽ sớm được cung cấp cho những người thử nghiệm đầu tiên của chúng tôi và những người dùng Grok hiện tại.”

Mặc dù chưa được phát hành công khai nhưng xAI cho biết Grok 1.5V sẽ sớm được cung cấp cho những người thử nghiệm sớm và người dùng Grok hiện tại.

Bài đăng cũng bao gồm thông tin điểm chuẩn chi tiết so sánh Grok 1.5V với các đối thủ cạnh tranh đa phương thức như ChatGPT-4V của OpenAI, Claude 3 Sonnet và Claude 3 Opus của Anthropic cũng như Gemini Pro 1.5 do Google sở hữu. Ngoài ra, bản phát hành còn chia sẻ bảy ví dụ khác nhau về cách Grok 1.5V có thể sử dụng thông tin trực quan, bao gồm việc sử dụng hình ảnh trong thế giới thực hoặc dịch biểu đồ thành mã.

Bạn có thể xem biểu đồ điểm chuẩn Grok 1.5V bên dưới, cùng với hai trong số các ví dụ về xử lý hình ảnh.

Tín dụng: xAI

Tín dụng: xAI

Tín dụng: xAI

Mô hình đa phương thức xuất hiện sau khi Musk cho biết vào đầu năm nay rằng xAI đang chuẩn bị ra mắt Grok 1.5. Trong một cuộc phỏng vấn được tổ chức vào đầu tuần này, Musk cũng nói rằng ông tin rằng chúng ta sẽ có AI thông minh hơn bất kỳ con người nào vào cuối năm 2025, trong khi ông cho rằng sức mạnh tính toán của AI sẽ vượt qua toàn bộ con người chỉ sau 5 năm nữa.

Tháng trước, xAI chính thức biến trọng lượng mô hình cơ sở và kiến ​​trúc mạng của Grok thành nguồn mở, sau nhiều lời chỉ trích của Musk và thậm chí là vụ kiện của OpenAI phi lợi nhuận trước đây vì đã từ bỏ sứ mệnh phi lợi nhuận và tránh biến các mô hình GPT của riêng mình thành nguồn mở.

Sau các báo cáo vào tháng 1 rằng tuyên bố xAI đã huy động vốnMusk phủ nhận các cáo buộc và nói thêm rằng công ty không có kế hoạch huy động vốn vào thời điểm này. Musk ra mắt xAI vào tháng 7 năm ngoái, và công ty tiếp tục ra mắt Grok là sản phẩm đầu tiên trong tháng mười một.

Cập nhật lúc 5:02 chiều MT: Đoạn thứ bảy đã được chỉnh sửa cho rõ ràng.

Quan điểm của bạn là gì? Hãy cho tôi biết tại zach@teslarati.com, tìm tôi trên X lúc @zacharyvisconti, hoặc gửi lời khuyên của bạn cho chúng tôi tại mẹo@teslarati.com.

XAI do Elon Musk dẫn đầu tiết lộ Grok 1.5V có tính năng xử lý hình ảnh




<!–

Xem bình luận

->

tại chỗ_img

Tin tức mới nhất

tại chỗ_img