제퍼넷 로고

Elon Musk가 이끄는 xAI, 시각 처리 기능을 갖춘 Grok 1.5V 공개

시간


엘론 머스크(Elon Musk)의 인공지능(AI) 회사인 xAI는 이번 주 회사에서 공유한 바와 같이 시각적인 처리가 가능한 Grok 언어 모델 버전을 출시할 예정입니다.

안에 릴리스를 누르십시오 xAI는 금요일 웹사이트에서 텍스트 처리와 함께 비디오를 처리하는 최초의 AI 모델인 Grok 1.5V 또는 Grok 1.5 Vision을 발표했습니다. 이 소식은 Grok이 이제 문서, 사진, 다이어그램 등과 같은 시각적 정보를 처리할 수 있을 뿐만 아니라 해당 모델이 다른 다중 모드 플랫폼과 경쟁할 수 있음을 의미합니다.

릴리스에서 xAI는 "1.5세대 다중 모드 모델인 Grok-1.5V를 소개합니다."라고 썼습니다. “강력한 텍스트 기능 외에도 Grok은 이제 문서, 다이어그램, 차트, 스크린샷, 사진을 포함한 다양한 시각적 정보를 처리할 수 있습니다. Grok-XNUMXV는 초기 테스터와 기존 Grok 사용자에게 곧 제공될 예정입니다.”

아직 공개적으로 출시되지는 않았지만 xAI는 Grok 1.5V가 곧 초기 테스터와 기존 Grok 사용자에게 제공될 것이라고 밝혔습니다.

이 게시물에는 Grok 1.5V를 OpenAI의 ChatGPT-4V, Anthropic의 Claude 3 Sonnet 및 Claude 3 Opus, Google 소유 Gemini Pro 1.5와 같은 다중 모드 경쟁업체와 비교하는 자세한 벤치마킹 정보도 포함되어 있습니다. 또한 이번 릴리스에서는 실제 이미지 사용이나 차트를 코드로 변환하는 등 Grok 1.5V가 시각적 정보를 어떻게 사용할 수 있는지에 대한 XNUMX가지 다른 예를 공유합니다.

아래의 Grok 1.5V 벤치마킹 차트와 두 가지 시각적 처리 예를 볼 수 있습니다.

크레딧: xAI

크레딧: xAI

크레딧: xAI

멀티모달 모델은 머스크가 올해 초 다음과 같이 말한 이후에 등장했습니다. xAI는 Grok 1.5 출시를 준비하고 있었습니다.. 이번주 초 진행된 인터뷰에서, 머스크는 또한 2025년 말까지 인간보다 더 똑똑한 AI를 갖게 될 것이라고 말했다., 그는 AI의 컴퓨팅 능력이 단 5년 안에 모든 인간을 능가할 것이라고 생각합니다.

지난 달, xAI는 공식적으로 Grok의 기본 모델 가중치와 네트워크 아키텍처를 오픈 소스로 만들었습니다.머스크는 비영리 임무를 포기하고 자체 GPT 모델 오픈 소스화를 피한 전 비영리 OpenAI에 대한 많은 비판과 심지어 소송까지 제기했습니다.

1월에 보고된 바에 따르면 xAI가 자본을 조달했다고 주장함머스크는 해당 의혹을 부인하며 현재로서는 회사가 자금을 조달할 계획이 없다고 덧붙였습니다. 머스크는 지난 7월 xAI를 데뷔했다., 그리고 회사는 계속해서 첫 번째 제품으로 Grok 출시 11월 인치

MT: 오후 5시 02분에 업데이트됨: 명확성을 위해 일곱 번째 단락이 편집되었습니다.

당신의 생각은 무엇입니까? 에서 알려주세요 zach@teslarati.com, X에서 나를 찾아주세요 @zacharyvisconti, 또는 다음 주소로 팁을 보내주세요. tip@teslarati.com.

Elon Musk가 이끄는 xAI, 시각 처리 기능을 갖춘 Grok 1.5V 공개




<!–

댓글보기

–>

spot_img

최신 인텔리전스

spot_img