ゼファーネットのロゴ

イーロン・マスク率いる xAI がビジュアル処理機能を備えた Grok 1.5V を発表

日付:


イーロン・マスク氏の人工知能(AI)企業xAIは、今週同社が共有したように、ビジュアルを処理できるGrok言語モデルのバージョンを導入する予定だ。

プレスリリース 金曜日にウェブサイトで共有された xAI は、テキストの処理と同時にビデオを処理する初の AI モデルである Grok 1.5V または Grok 1.5 Vision を発表しました。このニュースは、Grok が文書、写真、図などの視覚情報を処理できるようになり、モデルが他のマルチモーダル プラットフォームと競合できるようになったということを意味します。

「当社の第一世代マルチモーダル モデルである Grok-1.5V の紹介」と xAI はリリースに書いています。 「強力なテキスト機能に加えて、Grok は文書、図、グラフ、スクリーンショット、写真などのさまざまな視覚情報を処理できるようになりました。 Grok-1.5V は、初期テスターと既存の Grok ユーザーに間もなく提供される予定です。」

まだ一般にはリリースされていませんが、xAI によれば、Grok 1.5V は間もなく初期テスターと既存の Grok ユーザーに利用可能になる予定です。

この投稿には、Grok 1.5V を OpenAI の ChatGPT-4V、Anthropic の Claude 3 Sonnet および Claude 3 Opus、Google 所有の Gemini Pro 1.5 などのマルチモーダルな競合製品と比較する詳細なベンチマーク情報も含まれています。さらに、このリリースでは、実世界の画像の使用やチャートのコードへの変換など、Grok 1.5V が視覚情報をどのように使用できるかを示す XNUMX つの異なる例が共有されています。

以下の Grok 1.5V ベンチマーク チャートと、ビジュアル処理の XNUMX つの例をご覧ください。

クレジット: xAI

クレジット: xAI

クレジット: xAI

マルチモーダルモデルは、マスク氏が今年初めに次のように述べた後に登場した。 xAI は Grok 1.5 のリリースを準備していました。今週初めに行われたインタビューで、 マスク氏はまた、2025年末までに人間よりも賢いAIが誕生すると信じているとも語った。一方で、AI の計算能力はわずか 5 年以内に全人類を超えるだろうと彼は考えています。

先月、 xAI が Grok の基本モデルの重みとネットワーク アーキテクチャを正式にオープンソース化、マスク氏の多くの批判と、非営利の使命を放棄し、独自の GPT モデルのオープンソース化を回避したとして元非営利団体 OpenAI が訴訟さえ受けた後。

1月の報道を受けて、 xAIが資金を調達していたと主張, マスク氏は疑惑を否定し、現時点では資金調達の計画はないと付け加えた。 マスク氏は昨年7月にxAIをデビューさせた、そして会社はさらに進みました 最初の製品として Grok を発売する 11月である。

MT 午後 5:02 更新: 明確にするために XNUMX 番目の段落を編集しました。

どう思いますか? までお知らせください zach@teslarati.com、Xで私を見つけてください @zacharyvisconti、またはヒントを次のアドレスに送信してください。 Tips@teslarati.com.

イーロン・マスク率いる xAI がビジュアル処理機能を備えた Grok 1.5V を発表




<!–

コメントを表示

–>

スポット画像

最新のインテリジェンス

スポット画像