Logotipo de Zephyrnet

Meta lanza su LLM de código abierto Llama 3 en Amazon AWS – Tech Startups

Fecha:

Siguiendo el éxito Lanzamiento del 'Código Llama 70B' En enero, Meta lanzó la última versión de su potente LLM de código abierto Llama 3 en la infraestructura de Amazon AWS.

En un correo electrónico a TechStartups, Amazon reveló que “ahora se puede acceder a Meta Llama 3 a través de JumpStart de Amazon SageMaker.” Esta última versión sigue los pasos de su predecesor, Llama 2, al que se puede acceder en Amazon SageMaker JumpStart y lecho rocoso del amazonas desde el año anterior.

Con dos tamaños de parámetros (8B y 70B con una longitud de contexto de 8k), Llama 3 promete atender una amplia gama de casos de uso con mejoras en el razonamiento, la generación de código y el seguimiento de instrucciones. La arquitectura de Llama 3 adopta un diseño de transformador solo decodificador junto con un tokenizador nuevo, lo que da como resultado un mayor rendimiento del modelo encapsulado en un tamaño de 128k.

"Llama 3 viene en dos tamaños de parámetros (8B y 70B con una longitud de contexto de 8k) que pueden admitir una amplia gama de casos de uso con mejoras en el razonamiento, la generación de código y el seguimiento de instrucciones", escribió Amazon.

Si está utilizando SageMaker Studio, encontrará SageMaker JumpStart allí mismo, que ofrece un montón de cosas útiles como modelos previamente entrenados, cuadernos y soluciones listas para usar. Simplemente dirígete a la sección "Soluciones prediseñadas y automatizadas" y ¡listo!

AWS SageMaker JumpStart (Fuente: Amazon AWS)

Cuando llegas a la página SageMaker JumpStart, es bastante sencillo encontrar diferentes modelos. Simplemente navegue por los centros, que son básicamente secciones que llevan el nombre de las personas que proporcionan los modelos. Por ejemplo, si estás buscando modelos Llama 3, dirígete al centro Meta. Y si no los detecta de inmediato, no se preocupe: simplemente intente actualizar su versión de SageMaker Studio apagándolo y reiniciándolo. ¡Eso debería hacer el truco!

AWS JumpStart (Fuente: Amazon AWS)

Además, Meta ha perfeccionado los procedimientos posteriores al entrenamiento para reducir significativamente las tasas de falsos rechazos, mejorar la alineación y aumentar la diversidad en las respuestas del modelo. Los usuarios ahora pueden aprovechar las ventajas combinadas de la destreza de Llama 3 y los controles MLOps aprovechando las funciones de Amazon SageMaker como SageMaker Pipelines, SageMaker Debugger o registros de contenedores. Además, el modelo se implementará dentro de los límites seguros de AWS bajo sus controles de VPC, fortaleciendo las medidas de seguridad de los datos.

En la actualidad, AWS es el único proveedor de nube que brinda a los clientes acceso a los modelos básicos más buscados y de vanguardia. Amazon Bedrock constantemente toma la iniciativa en hacer que estos modelos populares estén disponibles:

  • Amazon Bedrock se erige como el servicio administrado exclusivo y de primer nivel que ofrece todos los modelos de Anthropic Claude 3 (Opus, Sonnet y Haiku) disponibles de manera general.
  • AWS ha introducido todos los modelos de IA de Mistral, incluido Mistral Large, en Amazon Bedrock.
  • Amazon Bedrock encabezó la disponibilidad de Meta Llama 2 a través de una API administrada.

Al funcionar como un servicio totalmente administrado, Amazon Bedrock sirve como destino de referencia para una amplia selección de modelos básicos de alto rendimiento de titanes de la industria como AI21 Labs, Amazon, Anthropic, Cohere, Meta, Mistral AI y Stability AI, todos accesible a través de una única API. Además, proporciona un conjunto completo de capacidades que abarcan agentes, barreras de seguridad, bases de conocimiento y evaluación de modelos, lo que permite a las organizaciones crear aplicaciones de IA generativa con énfasis en la seguridad, la privacidad y la IA responsable. Con decenas de miles de organizaciones en todo el mundo confiando en Amazon Bedrock, ha solidificado su estatus como actor fundamental en el ámbito de las aplicaciones de IA generativa.

punto_img

Información más reciente

punto_img