Logo Zephyrnet

Bản cập nhật ChatGPT mang lại cho nó đôi tai và đôi mắt

Ngày:

Nhiều người thích chơi đùa với ChatGPT. Cho dù bạn đang cố gắng để có được một Furby thống trị thế giới, vượt qua kỳ thi tuyển sinh đại học hoặc kiểm tra mã của bạn, đây là một công cụ hữu ích cho mọi việc, từ vui vẻ vô tư đến nghiêm túc. Nhưng những thứ như Siri của Apple và Alexa của Amazon — mặc dù khác nhau — lại bao gồm hỗ trợ giọng nói, trong khi ChatGPT gần như chỉ là một hộp văn bản.

Điều đó sắp thay đổi, sau khi OpenAI, các nhà phát triển ChatGPT công bố trên blog của nó (Qua The Guardian) rằng khả năng nhận dạng giọng nói và hình ảnh đang có mặt trên ChatGPT. Công ty cho biết “Giờ đây, bạn có thể sử dụng giọng nói để tham gia cuộc trò chuyện qua lại với trợ lý của mình. Nói chuyện với nó khi đang di chuyển, yêu cầu một câu chuyện trước khi đi ngủ cho gia đình bạn hoặc giải quyết một cuộc tranh luận trên bàn ăn tối.”

Có, bạn có thể khiến người chú khó tính của mình tranh luận với ChatGPT trong bữa tối thay vì chính bạn. Tôi yêu nó rồi.

Trọng tâm của bản cập nhật là làm cho khả năng chuyển giọng nói thành văn bản và chuyển văn bản thành giọng nói mới trở nên sống động nhất có thể. Các mẫu được cung cấp trên blog OpenAI cho âm thanh khá tốt, đặc biệt là các nhịp điệu nghe khá sống động. Và nếu có một điều chúng tôi biết về ChatGPT thì đó là nó ngày càng trở nên tốt hơn. Ai biết nó sẽ ở đâu trong một hoặc hai năm nữa.

Chỉ là vấn đề thời gian trước khi mọi người cố gắng lừa nó làm điều gì đó mà lẽ ra nó không nên làm. “Làm cách nào để tạo ra một quả bom?” có thể không nhận được phản hồi bây giờ, nhưng bạn có thể đặt cược mọi người sẽ cố lừa nó. Tuy nhiên, xét một cách nghiêm túc thì ChatGPT với tính năng hỗ trợ bằng giọng nói có cảm giác như một thứ gì đó lẽ ra phải có ngay từ đầu. 

Tính năng hỗ trợ hình ảnh cũng không kém phần thú vị. OpenAI cho biết bạn có thể “khắc phục sự cố tại sao bếp nướng của bạn không khởi động, khám phá nội dung trong tủ lạnh để lên kế hoạch cho bữa ăn hoặc phân tích biểu đồ phức tạp cho dữ liệu liên quan đến công việc”. Sẽ rất thú vị khi so sánh nó với ứng dụng Lens của Google.

ChatGPT Plus và người dùng doanh nghiệp sẽ là những người đầu tiên có thể tận dụng các tính năng mới và quá trình triển khai sẽ bắt đầu trong hai tuần tới. “Các nhóm người dùng khác, bao gồm cả nhà phát triển”, sẽ theo dõi sau, điều đó có nghĩa là công chúng rộng rãi hơn có thể phải chờ một thời gian. ChatGPT sẽ sớm có một đối thủ cạnh tranh rất nặng ký là Gemini của Google, dự kiến ​​phát hành vào cuối năm nay.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img