Zephyrnet-Logo

xAI unter der Leitung von Elon Musk stellt Grok 1.5V mit visueller Verarbeitung vor

Datum:


Elon Musks Unternehmen für künstliche Intelligenz (KI), xAI, wird eine Version seines Sprachmodells Grok vorstellen, das visuelle Darstellungen verarbeiten kann, wie das Unternehmen diese Woche mitteilte.

In einer Pressemitteilung Wie xAI am Freitag auf seiner Website mitteilte, kündigte es Grok 1.5V oder Grok 1.5 Vision an, sein erstes KI-Modell, das neben der Textverarbeitung auch Videos verarbeitet. Die Neuigkeit bedeutet, dass Grok nun visuelle Informationen wie Dokumente, Fotos, Diagramme und mehr verarbeiten kann und das Modell gleichzeitig mit anderen multimodalen Plattformen konkurrenzfähig macht.

„Wir stellen Grok-1.5V vor, unser multimodales Modell der ersten Generation“, schreibt xAI in der Pressemitteilung. „Zusätzlich zu seinen starken Textfunktionen kann Grok jetzt eine Vielzahl visueller Informationen verarbeiten, darunter Dokumente, Diagramme, Diagramme, Screenshots und Fotos. Grok-1.5V wird bald für unsere ersten Tester und bestehenden Grok-Benutzer verfügbar sein.“

Obwohl es noch nicht öffentlich veröffentlicht wurde, sagt xAI, dass Grok 1.5V bald für frühe Tester und bestehende Grok-Benutzer verfügbar sein wird.

Der Beitrag enthält außerdem detaillierte Benchmarking-Informationen zum Vergleich von Grok 1.5V mit multimodalen Konkurrenten wie ChatGPT-4V von OpenAI, Claude 3 Sonnet und Claude 3 Opus von Anthropic sowie dem Google-eigenen Gemini Pro 1.5. Darüber hinaus enthält die Veröffentlichung sieben verschiedene Beispiele dafür, wie Grok 1.5V visuelle Informationen nutzen kann, einschließlich der Verwendung realer Bilder oder der Übersetzung von Diagrammen in Code.

Unten sehen Sie das Grok 1.5V-Benchmarking-Diagramm sowie zwei Beispiele für die visuelle Verarbeitung.

Bildnachweis: xAI

Bildnachweis: xAI

Bildnachweis: xAI

Das multimodale Modell kommt, nachdem Musk dies Anfang des Jahres gesagt hat xAI bereitete die Einführung von Grok 1.5 vor. In einem Interview, das Anfang dieser Woche stattfand, Musk sagte auch, dass er glaubt, dass wir bis Ende 2025 eine KI haben werden, die intelligenter ist als jeder einzelne Mensch, während er glaubt, dass die Rechenleistung der KI in nur fünf Jahren die aller Menschen übertreffen wird.

Letzten Monat xAI hat Groks Basismodellgewichte und Netzwerkarchitektur offiziell als Open Source bereitgestellt, nach Musks zahlreicher Kritik und sogar einer Klage gegen die ehemalige Non-Profit-Organisation OpenAI, weil sie ihre Non-Profit-Mission aufgegeben und es vermieden hatte, ihre eigenen GPT-Modelle als Open Source zu veröffentlichen.

Nach Berichten im Januar, dass behauptete, xAI habe Kapital aufgenommen, Musk wies die Vorwürfe zurück und fügte hinzu, dass das Unternehmen derzeit keine Pläne habe, Finanzmittel aufzubringen. Musk stellte im vergangenen Juli xAI vor, und das Unternehmen fuhr fort bringt Grok als erstes Produkt auf den Markt im November.

Aktualisiert um 5:02 Uhr MT: Siebter Absatz aus Gründen der Klarheit bearbeitet.

Was sind deine Gedanken? Lass es mich wissen unter zach@teslarati.com, finden Sie mich auf X unter @zacharyvisconti, oder senden Sie uns Ihre Tipps an tipps@teslarati.com.

xAI unter der Leitung von Elon Musk stellt Grok 1.5V mit visueller Verarbeitung vor




<!–

Kommentare anzeigen

->

spot_img

Neueste Intelligenz

spot_img