イーロン・マスク氏の人工知能(AI)企業xAIは、今週同社が共有したように、ビジュアルを処理できるGrok言語モデルのバージョンを導入する予定だ。
で プレスリリース 金曜日にウェブサイトで共有された xAI は、テキストの処理と同時にビデオを処理する初の AI モデルである Grok 1.5V または Grok 1.5 Vision を発表しました。このニュースは、Grok が文書、写真、図などの視覚情報を処理できるようになり、モデルが他のマルチモーダル プラットフォームと競合できるようになったということを意味します。
「当社の第一世代マルチモーダル モデルである Grok-1.5V の紹介」と xAI はリリースに書いています。 「強力なテキスト機能に加えて、Grok は文書、図、グラフ、スクリーンショット、写真などのさまざまな視覚情報を処理できるようになりました。 Grok-1.5V は、初期テスターと既存の Grok ユーザーに間もなく提供される予定です。」
まだ一般にはリリースされていませんが、xAI によれば、Grok 1.5V は間もなく初期テスターと既存の Grok ユーザーに利用可能になる予定です。
この投稿には、Grok 1.5V を OpenAI の ChatGPT-4V、Anthropic の Claude 3 Sonnet および Claude 3 Opus、Google 所有の Gemini Pro 1.5 などのマルチモーダルな競合製品と比較する詳細なベンチマーク情報も含まれています。さらに、このリリースでは、実世界の画像の使用やチャートのコードへの変換など、Grok 1.5V が視覚情報をどのように使用できるかを示す XNUMX つの異なる例が共有されています。
以下の Grok 1.5V ベンチマーク チャートと、ビジュアル処理の XNUMX つの例をご覧ください。
マルチモーダルモデルは、マスク氏が今年初めに次のように述べた後に登場した。 xAI は Grok 1.5 のリリースを準備していました。今週初めに行われたインタビューで、 マスク氏はまた、2025年末までに人間よりも賢いAIが誕生すると信じているとも語った。一方で、AI の計算能力はわずか 5 年以内に全人類を超えるだろうと彼は考えています。
先月、 xAI が Grok の基本モデルの重みとネットワーク アーキテクチャを正式にオープンソース化、マスク氏の多くの批判と、非営利の使命を放棄し、独自の GPT モデルのオープンソース化を回避したとして元非営利団体 OpenAI が訴訟さえ受けた後。
░W░E░I░G░H░T░S░I░N░B░I░O░
— グロク (@grok) 2024 年 3 月 17 日
1月の報道を受けて、 xAIが資金を調達していたと主張, マスク氏は疑惑を否定し、現時点では資金調達の計画はないと付け加えた。 マスク氏は昨年7月にxAIをデビューさせた、そして会社はさらに進みました 最初の製品として Grok を発売する 11月である。
MT 午後 5:02 更新: 明確にするために XNUMX 番目の段落を編集しました。
どう思いますか? までお知らせください zach@teslarati.com、Xで私を見つけてください @zacharyvisconti、またはヒントを次のアドレスに送信してください。 Tips@teslarati.com.
<!–
–>
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.teslarati.com/elon-musk-xai-grok-1-5v-visual/