Các mô hình nhúng OpenAI mới cung cấp những gì?

Lĩnh vực trí tuệ nhân tạo tiếp tục phát triển với các mô hình nhúng OpenAI mới. Chúng được thiết lập để xác định lại cách các nhà phát triển tiếp cận việc xử lý ngôn ngữ tự nhiên. Trước khi khám phá hai mô hình đột phá, mỗi mô hình được thiết kế để nâng cao khả năng của các ứng dụng AI, đây là những gì nhúng nghĩa là:

Các phần nhúng văn bản của OpenAI đóng vai trò là thước đo để đánh giá mối tương quan giữa các chuỗi văn bản, tìm kiếm ứng dụng trong các lĩnh vực khác nhau, bao gồm:

Tìm kiếm: Được sử dụng để xếp hạng kết quả dựa trên mức độ liên quan của chúng với chuỗi truy vấn nhất định, nâng cao độ chính xác của kết quả tìm kiếm.
Clustering: Được sử dụng để nhóm các chuỗi văn bản dựa trên sự giống nhau của chúng, tạo điều kiện thuận lợi cho việc tổ chức các thông tin liên quan.
Khuyến nghị: Ứng dụng trong các hệ thống gợi ý để gợi ý những mục có điểm chung trong chuỗi văn bản, nâng cao tính cá nhân hóa của gợi ý.
Phát hiện bất thường: Được sử dụng để xác định các ngoại lệ với mức độ liên quan tối thiểu, hỗ trợ phát hiện các mẫu hoặc điểm dữ liệu bất thường.
Đo đa dạng: Được sử dụng để phân tích sự phân bố tương tự, cho phép đánh giá tính đa dạng trong các tập dữ liệu hoặc tập hợp văn bản.
phân loại: Được triển khai trong các nhiệm vụ phân loại trong đó các chuỗi văn bản được phân loại theo nhãn giống nhau nhất, hợp lý hóa quy trình gắn nhãn trong các ứng dụng máy học.

Bây giờ bạn đã sẵn sàng khám phá các mô hình nhúng OpenAI mới!

Các mô hình nhúng OpenAI mới đã xuất hiện

Sự ra đời của các mô hình nhúng OpenAI mới đánh dấu một bước nhảy vọt đáng kể trong xử lý ngôn ngữ tự nhiên, cho phép các nhà phát triển thể hiện và hiểu nội dung văn bản tốt hơn. Hãy cùng đi sâu vào chi tiết của những mẫu cải tiến này: nhúng văn bản-3-nhỏ và nhúng văn bản-3-lớn.

nhúng văn bản-3-nhỏ

Mẫu nhỏ gọn nhưng mạnh mẽ này thể hiện hiệu suất tăng đáng kể so với mẫu tiền nhiệm của nó, text-embed-ada-002. Trên điểm chuẩn truy xuất đa ngôn ngữ (MIRACL), điểm trung bình đã tăng từ 31.4% lên mức ấn tượng 44.0%. Tương tự, trên bài kiểm tra tiếng Anh (MTEB), điểm trung bình đã tăng đáng khen ngợi từ 61.0% lên 62.3%. Tuy nhiên, điều làm nên sự khác biệt của text-embeding-3-small không chỉ là hiệu suất nâng cao mà còn là khả năng chi trả của nó.

Đánh giá điểm chuẩn	ada v2	nhúng văn bản-3-nhỏ	nhúng văn bản-3-lớn
trung bình MIRACL	31.4	44.0	54.9
trung bình MTEB	61.0	62.3	64.6

OpenAI đã giảm giá đáng kể, giúp nó tiết kiệm chi phí gấp 5 lần so với nhúng văn bản-ada-002, với giá mỗi 1k mã thông báo giảm từ 0.0001 USD xuống 0.00002 USD. Điều này làm cho text-embed-3-small không chỉ là lựa chọn hiệu quả hơn mà còn là lựa chọn dễ tiếp cận hơn đối với các nhà phát triển.

nhúng văn bản-3-lớn

Đại diện cho thế hệ tiếp theo của mô hình nhúng, text-embed-3-large giới thiệu sự gia tăng đáng kể về kích thước, hỗ trợ nhúng với tối đa 3072 kích thước. Mô hình lớn hơn này cung cấp sự trình bày chi tiết và sắc thái hơn về nội dung văn bản. Về hiệu suất, text-embed-3-large vượt trội hơn người tiền nhiệm của nó qua các điểm chuẩn. Trên MIRACL, điểm trung bình đã tăng từ 31.4% lên mức ấn tượng 54.9%, làm nổi bật khả năng truy xuất đa ngôn ngữ của nó.

	ada v2	nhúng văn bản-3-nhỏ		nhúng văn bản-3-lớn
Kích thước nhúng	1536	512	1536	256	1024	3072
Điểm MTEB trung bình	61.0	61.6	62.3	62.0	64.1	64.6

Tương tự, ở bài MTEB, điểm trung bình đã tăng từ 61.0% lên 64.6%, thể hiện sự vượt trội trong các bài tập tiếng Anh. Với mức giá 0.00013 USD cho mỗi 1k mã thông báo, tính năng nhúng văn bản-3-lớn tạo ra sự cân bằng giữa hiệu suất vượt trội và hiệu quả về chi phí, mang đến cho các nhà phát triển một giải pháp mạnh mẽ cho các ứng dụng yêu cầu nhúng theo chiều cao.

Gặp gỡ Google Lumiere AI, anh họ người làm video của Bard

Hỗ trợ gốc để rút ngắn phần nhúng

Nhận thấy nhu cầu đa dạng của các nhà phát triển, OpenAI giới thiệu hỗ trợ riêng để rút ngắn thời gian nhúng. Kỹ thuật cải tiến này cho phép các nhà phát triển tùy chỉnh kích thước nhúng bằng cách điều chỉnh tham số API kích thước. Bằng cách đó, các nhà phát triển có thể đánh đổi một số hiệu suất để có kích thước vectơ nhỏ hơn mà không ảnh hưởng đến các thuộc tính cơ bản của quá trình nhúng. Tính linh hoạt này đặc biệt có giá trị trong các tình huống mà hệ thống chỉ hỗ trợ nhúng ở một kích thước nhất định, cung cấp cho nhà phát triển một công cụ linh hoạt cho nhiều tình huống sử dụng khác nhau.

Tóm lại, các mô hình nhúng mới của OpenAI thể hiện một bước tiến đáng kể về hiệu quả, khả năng chi trả và hiệu suất. Cho dù các nhà phát triển lựa chọn cách thể hiện nhỏ gọn nhưng hiệu quả của văn bản-nhúng-3-nhỏ hay nhúng rộng rãi và chi tiết hơn của văn bản-nhúng-3-lớn, các mô hình này đều trao quyền cho các nhà phát triển các công cụ linh hoạt để rút ra những hiểu biết sâu sắc hơn từ dữ liệu văn bản trong AI của họ các ứng dụng.

Để biết thêm thông tin chi tiết về các mô hình nhúng OpenAI mới, hãy nhấp vào tại đây và nhận được thông báo chính thức.

Tín dụng hình ảnh nổi bật: Levart_Nhiếp ảnh gia/Bapt

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
nguồn: https://dataconomy.com/2024/01/26/new-openai-embedding-models/

Trí thông minh dữ liệu tạo

Các mô hình nhúng OpenAI mới cung cấp những gì?

Các mô hình nhúng OpenAI mới đã xuất hiện

nhúng văn bản-3-nhỏ

nhúng văn bản-3-lớn

Hỗ trợ gốc để rút ngắn phần nhúng

Bay trên hãng hàng không Koryo của Triều Tiên

Danh hiệu đặc biệt “Có đến Châu Âu” năm 2024 của Áo

Tin tức mới nhất

Tesla ra mắt lãi suất cho vay APR 0.99% trong thời gian giới hạn đối với các đơn đặt hàng Model Y của Hoa Kỳ

Ford giảm đơn đặt hàng pin vì lỗ hơn 100,000 USD cho mỗi xe điện bán ra

Danh sách theo dõi triển vọng dự thảo năm 2025 của NFL: Sự an toàn

Máy bay Boeing 777 của KLM hạ cánh khẩn cấp ở Ankara sau dấu hiệu cháy hàng hóa

BlockDAG ra mắt bản phát triển thứ 26 cho mạng Bolster để nâng cao khả năng mở rộng với thanh khoản 100 triệu USD

BlockDAG dẫn đầu khoản phí tiền điện tử được hỗ trợ bởi những người có ảnh hưởng trên Youtube với mức bán trước 24.9 triệu đô la, vượt trội TON và IMX