Logo Zephyrnet

Các mô hình nhúng OpenAI mới cung cấp những gì?

Ngày:

Lĩnh vực trí tuệ nhân tạo tiếp tục phát triển với các mô hình nhúng OpenAI mới. Chúng được thiết lập để xác định lại cách các nhà phát triển tiếp cận việc xử lý ngôn ngữ tự nhiên. Trước khi khám phá hai mô hình đột phá, mỗi mô hình được thiết kế để nâng cao khả năng của các ứng dụng AI, đây là những gì nhúng nghĩa là:

Các phần nhúng văn bản của OpenAI đóng vai trò là thước đo để đánh giá mối tương quan giữa các chuỗi văn bản, tìm kiếm ứng dụng trong các lĩnh vực khác nhau, bao gồm:

  • Tìm kiếm: Được sử dụng để xếp hạng kết quả dựa trên mức độ liên quan của chúng với chuỗi truy vấn nhất định, nâng cao độ chính xác của kết quả tìm kiếm.
  • Clustering: Được sử dụng để nhóm các chuỗi văn bản dựa trên sự giống nhau của chúng, tạo điều kiện thuận lợi cho việc tổ chức các thông tin liên quan.
  • Khuyến nghị: Ứng dụng trong các hệ thống gợi ý để gợi ý những mục có điểm chung trong chuỗi văn bản, nâng cao tính cá nhân hóa của gợi ý.
  • Phát hiện bất thường: Được sử dụng để xác định các ngoại lệ với mức độ liên quan tối thiểu, hỗ trợ phát hiện các mẫu hoặc điểm dữ liệu bất thường.
  • Đo đa dạng: Được sử dụng để phân tích sự phân bố tương tự, cho phép đánh giá tính đa dạng trong các tập dữ liệu hoặc tập hợp văn bản.
  • phân loại: Được triển khai trong các nhiệm vụ phân loại trong đó các chuỗi văn bản được phân loại theo nhãn giống nhau nhất, hợp lý hóa quy trình gắn nhãn trong các ứng dụng máy học.

Bây giờ bạn đã sẵn sàng khám phá các mô hình nhúng OpenAI mới!

Các mô hình nhúng OpenAI mới đã xuất hiện

Sự ra đời của các mô hình nhúng OpenAI mới đánh dấu một bước nhảy vọt đáng kể trong xử lý ngôn ngữ tự nhiên, cho phép các nhà phát triển thể hiện và hiểu nội dung văn bản tốt hơn. Hãy cùng đi sâu vào chi tiết của những mẫu cải tiến này: nhúng văn bản-3-nhỏnhúng văn bản-3-lớn.

Khám phá các mô hình nhúng OpenAI mới – nhúng văn bản-3-nhỏ và nhúng-3-lớn – nâng cao khả năng chi trả, hiệu suất và hơn thế nữa!
Các mô hình nhúng OpenAI mới, văn bản-nhúng-3-nhỏ và văn bản-nhúng-3-lớn, cho thấy những tiến bộ đáng kể trong xử lý ngôn ngữ tự nhiên, đáp ứng nhu cầu đa dạng của nhà phát triển (Tín dụng hình ảnh)

nhúng văn bản-3-nhỏ

Mẫu nhỏ gọn nhưng mạnh mẽ này thể hiện hiệu suất tăng đáng kể so với mẫu tiền nhiệm của nó, text-embed-ada-002. Trên điểm chuẩn truy xuất đa ngôn ngữ (MIRACL), điểm trung bình đã tăng từ 31.4% lên mức ấn tượng 44.0%. Tương tự, trên bài kiểm tra tiếng Anh (MTEB), điểm trung bình đã tăng đáng khen ngợi từ 61.0% lên 62.3%. Tuy nhiên, điều làm nên sự khác biệt của text-embeding-3-small không chỉ là hiệu suất nâng cao mà còn là khả năng chi trả của nó.

Đánh giá điểm chuẩn ada v2 nhúng văn bản-3-nhỏ nhúng văn bản-3-lớn
trung bình MIRACL 31.4 44.0 54.9
trung bình MTEB 61.0 62.3 64.6

OpenAI đã giảm giá đáng kể, giúp nó tiết kiệm chi phí gấp 5 lần so với nhúng văn bản-ada-002, với giá mỗi 1k mã thông báo giảm từ 0.0001 USD xuống 0.00002 USD. Điều này làm cho text-embed-3-small không chỉ là lựa chọn hiệu quả hơn mà còn là lựa chọn dễ tiếp cận hơn đối với các nhà phát triển.

nhúng văn bản-3-lớn

Đại diện cho thế hệ tiếp theo của mô hình nhúng, text-embed-3-large giới thiệu sự gia tăng đáng kể về kích thước, hỗ trợ nhúng với tối đa 3072 kích thước. Mô hình lớn hơn này cung cấp sự trình bày chi tiết và sắc thái hơn về nội dung văn bản. Về hiệu suất, text-embed-3-large vượt trội hơn người tiền nhiệm của nó qua các điểm chuẩn. Trên MIRACL, điểm trung bình đã tăng từ 31.4% lên mức ấn tượng 54.9%, làm nổi bật khả năng truy xuất đa ngôn ngữ của nó.

ada v2 nhúng văn bản-3-nhỏ nhúng văn bản-3-lớn
Kích thước nhúng 1536 512 1536 256 1024 3072
Điểm MTEB trung bình 61.0 61.6 62.3 62.0 64.1 64.6

Tương tự, ở bài MTEB, điểm trung bình đã tăng từ 61.0% lên 64.6%, thể hiện sự vượt trội trong các bài tập tiếng Anh. Với mức giá 0.00013 USD cho mỗi 1k mã thông báo, tính năng nhúng văn bản-3-lớn tạo ra sự cân bằng giữa hiệu suất vượt trội và hiệu quả về chi phí, mang đến cho các nhà phát triển một giải pháp mạnh mẽ cho các ứng dụng yêu cầu nhúng theo chiều cao.


Gặp gỡ Google Lumiere AI, anh họ người làm video của Bard


Hỗ trợ gốc để rút ngắn phần nhúng

Nhận thấy nhu cầu đa dạng của các nhà phát triển, OpenAI giới thiệu hỗ trợ riêng để rút ngắn thời gian nhúng. Kỹ thuật cải tiến này cho phép các nhà phát triển tùy chỉnh kích thước nhúng bằng cách điều chỉnh tham số API kích thước. Bằng cách đó, các nhà phát triển có thể đánh đổi một số hiệu suất để có kích thước vectơ nhỏ hơn mà không ảnh hưởng đến các thuộc tính cơ bản của quá trình nhúng. Tính linh hoạt này đặc biệt có giá trị trong các tình huống mà hệ thống chỉ hỗ trợ nhúng ở một kích thước nhất định, cung cấp cho nhà phát triển một công cụ linh hoạt cho nhiều tình huống sử dụng khác nhau.

Khám phá các mô hình nhúng OpenAI mới – nhúng văn bản-3-nhỏ và nhúng-3-lớn – nâng cao khả năng chi trả, hiệu suất và hơn thế nữa!
Khả năng chi trả của text-embed-3-small được nhấn mạnh bằng việc giảm giá 5 lần so với phiên bản trước đó, text-embed-ada-002, khiến nó trở thành lựa chọn tiết kiệm chi phí cho các nhà phát triển (Tín dụng hình ảnh)

Tóm lại, các mô hình nhúng mới của OpenAI thể hiện một bước tiến đáng kể về hiệu quả, khả năng chi trả và hiệu suất. Cho dù các nhà phát triển lựa chọn cách thể hiện nhỏ gọn nhưng hiệu quả của văn bản-nhúng-3-nhỏ hay nhúng rộng rãi và chi tiết hơn của văn bản-nhúng-3-lớn, các mô hình này đều trao quyền cho các nhà phát triển các công cụ linh hoạt để rút ra những hiểu biết sâu sắc hơn từ dữ liệu văn bản trong AI của họ các ứng dụng.

Để biết thêm thông tin chi tiết về các mô hình nhúng OpenAI mới, hãy nhấp vào tại đây và nhận được thông báo chính thức.

Tín dụng hình ảnh nổi bật: Levart_Nhiếp ảnh gia/Bapt

tại chỗ_img

Tin tức mới nhất

tại chỗ_img