Logo Zephyrnet

Introducerea mai multor funcții de nivel enterprise pentru clienții API

Data:

Pentru a ajuta organizațiile să-și extindă utilizarea AI fără a-și supraextinde bugetele, am adăugat două noi modalități de a reduce costurile pentru sarcinile de lucru consistente și asincrone:

  • Utilizare redusă la debitul angajat: Clienții cu un nivel susținut de utilizare a jetoanelor pe minut (TPM) pe GPT-4 sau GPT-4 Turbo pot solicita acces la debitul furnizat pentru a obține reduceri cuprinse între 10 și 50%, în funcție de dimensiunea angajamentului.
  • Costuri reduse la sarcinile de lucru asincrone: Clienții pot folosi noul nostru Batch API pentru a rula sarcini de lucru non-urgente în mod asincron. Solicitările API în lot au un preț de 50% reducere la prețurile partajate, oferă limite de rate mult mai mari și returnează rezultate în 24 de ore. Acest lucru este ideal pentru cazuri de utilizare precum evaluarea modelului, clasificarea offline, rezumarea și generarea de date sintetice.


Intenționăm să continuăm să adăugăm noi funcții axate pe securitate la nivel de întreprindere, controale administrative și managementul costurilor. Pentru mai multe informații despre aceste lansări, vizitați Documentație API or luați legătura cu echipa noastră pentru a discuta despre soluții personalizate pentru întreprinderea dvs.

spot_img

Ultimele informații

spot_img