Aby pomóc organizacjom skalować wykorzystanie sztucznej inteligencji bez nadmiernego zwiększania budżetów, dodaliśmy dwa nowe sposoby obniżania kosztów w przypadku spójnych i asynchronicznych obciążeń:
- Zniżki na zatwierdzoną przepustowość: Klienci ze stałym poziomem wykorzystania tokenów na minutę (TPM) w GPT-4 lub GPT-4 Turbo mogą poprosić o dostęp do zapewnionej przepustowości, aby uzyskać rabaty w wysokości od 10 do 50% w zależności od wielkości zobowiązania.
- Obniżone koszty obciążeń asynchronicznych: Klienci mogą korzystać z naszej nowości Wsadowe API do asynchronicznego uruchamiania niepilnych obciążeń. Żądania Batch API są wyceniane o 50% taniej niż ceny wspólne, oferują znacznie wyższe limity stawek i zwracają wyniki w ciągu 24 godzin. Jest to idealne rozwiązanie w przypadkach użycia, takich jak ocena modelu, klasyfikacja offline, podsumowywanie i syntetyczne generowanie danych.
Planujemy dodawać nowe funkcje skupiające się na zabezpieczeniach klasy korporacyjnej, kontrolach administracyjnych i zarządzaniu kosztami. Aby uzyskać więcej informacji na temat tych premier, odwiedź naszą stronę Dokumentacja API or skontaktuj się z naszym zespołem w celu omówienia niestandardowych rozwiązań dla Twojego przedsiębiorstwa.
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://openai.com/blog/more-enterprise-grade-features-for-api-customers