Zephyrnet-Logo

Meta startet sein Llama 3 Open-Source-LLM auf Amazon AWS – Tech Startups

Datum:

Im Anschluss an die erfolgreiche Einführung von „Code Llama 70B“ Im Januar hat Meta nun die neueste Version seines Open-Source-LLM-Kraftpakets Llama 3 auf der Infrastruktur von Amazon AWS veröffentlicht.

In einer E-Mail an TechStartups gab Amazon bekannt, dass „Meta Llama 3 jetzt über zugänglich ist.“ Amazon SageMaker-JumpStart.“ Diese neueste Version tritt in die Fußstapfen ihres Vorgängers Llama 2, der auf Amazon SageMaker JumpStart und verfügbar war Amazonas Grundgestein seit dem Vorjahr.

Mit zwei Parametergrößen – 8B und 70B mit einer Kontextlänge von 8k – verspricht Llama 3, eine Vielzahl von Anwendungsfällen mit Verbesserungen bei Argumentation, Codegenerierung und Befehlsfolge abzudecken. Die Architektur von Llama 3 verwendet ein reines Decoder-Transformator-Design in Verbindung mit einem neuen Tokenizer, was zu einer erhöhten Modellleistung in einer Größe von 128 KB führt.

„Llama 3 ist in zwei Parametergrößen erhältlich – 8B und 70B mit 8k Kontextlänge – die eine breite Palette von Anwendungsfällen mit Verbesserungen bei Argumentation, Codegenerierung und Befehlsfolge unterstützen können“, schrieb Amazon.

Wenn Sie SageMaker Studio verwenden, finden Sie dort SageMaker JumpStart, das eine Reihe praktischer Dinge wie vorab trainierte Modelle, Notebooks und vorgefertigte Lösungen bietet. Gehen Sie einfach zum Abschnitt „Vorgefertigte und automatisierte Lösungen“ und schon sind Sie startklar!

AWS SageMaker JumpStart (Quelle: Amazon AWS)

Wenn Sie auf der SageMaker JumpStart-Seite landen, ist es ziemlich einfach, verschiedene Modelle zu finden. Stöbern Sie einfach durch die Hubs, bei denen es sich im Wesentlichen um Abschnitte handelt, die nach den Personen benannt sind, die die Modelle bereitstellen. Wenn Sie beispielsweise nach Llama 3-Modellen suchen, besuchen Sie den Meta-Hub. Und wenn Sie sie nicht sofort bemerken, machen Sie sich keine Sorgen – versuchen Sie einfach, Ihre SageMaker Studio-Version zu aktualisieren, indem Sie sie herunterfahren und neu starten. Das sollte den Zweck erfüllen!

AWS JumpStart (Quelle: Amazon AWS)

Darüber hinaus hat Meta die Verfahren nach dem Training verfeinert, um die Rate falscher Ablehnungen erheblich zu senken, die Ausrichtung zu verbessern und die Vielfalt der Modellantworten zu erhöhen. Benutzer können jetzt die kombinierten Vorteile der Leistungsfähigkeit und MLOps-Steuerung von Llama 3 nutzen, indem sie Amazon SageMaker-Funktionen wie SageMaker Pipelines, SageMaker Debugger oder Containerprotokolle nutzen. Darüber hinaus wird das Modell innerhalb der sicheren Grenzen von AWS unter deren VPC-Kontrolle bereitgestellt, wodurch die Datensicherheitsmaßnahmen gestärkt werden.

Derzeit ist AWS der einzige Cloud-Anbieter, der seinen Kunden Zugang zu den gefragtesten und modernsten Basismodellen bietet. Amazon Bedrock übernimmt stets die Führung bei der Bereitstellung dieser beliebten Modelle:

  • Amazon Bedrock ist der führende und exklusive Managed Service, der alle Anthropic Claude 3-Modelle – Opus, Sonnet und Haiku – als allgemein verfügbar anbietet.
  • AWS hat alle Mistral-KI-Modelle, einschließlich Mistral Large, auf Amazon Bedrock eingeführt.
  • Amazon Bedrock war Vorreiter bei der Verfügbarkeit von Meta Llama 2 über eine verwaltete API.

Als vollständig verwalteter Dienst dient Amazon Bedrock als Anlaufstelle für eine umfangreiche Auswahl leistungsstarker Fundamentmodelle von Branchenriesen wie AI21 Labs, Amazon, Anthropic, Cohere, Meta, Mistral AI und Stability AI über eine einzige API zugänglich. Darüber hinaus bietet es eine umfassende Suite von Funktionen, die Agenten, Leitplanken, Wissensdatenbanken und Modellevaluierung umfasst und es Unternehmen ermöglicht, generative KI-Anwendungen mit Schwerpunkt auf Sicherheit, Datenschutz und verantwortungsvoller KI zu entwickeln. Da Zehntausende Organisationen weltweit auf Amazon Bedrock vertrauen, hat das Unternehmen seinen Status als zentraler Akteur im Bereich generativer KI-Anwendungen gefestigt.

spot_img

Neueste Intelligenz

spot_img