제퍼넷 로고

누가 생성 AI 플랫폼을 소유합니까?

시간

생성적 인공 지능(AI)에서 기술 스택의 초기 단계가 등장하기 시작했습니다. 수백 개의 새로운 스타트업이 기초 모델을 개발하고, AI 네이티브 앱을 구축하고, 인프라/도구를 세우기 위해 시장에 뛰어들고 있습니다.

많은 최신 기술 트렌드는 시장이 따라잡기 훨씬 전에 과장됩니다. 그러나 제너레이티브 AI 붐은 실제 시장에서의 실질적인 이익과 실제 회사의 실질적인 견인력을 동반했습니다. Stable Diffusion 및 ChatGPT와 같은 모델은 사용자 증가에 대한 역사적 기록을 세우고 있으며 여러 애플리케이션은 출시 후 100년 이내에 연간 매출 XNUMX억 달러에 도달했습니다. 나란히 비교하면 AI 모델이 표시됩니다. 인간을 능가하다 일부 작업에서 여러 배의 크기로. 

따라서 대대적인 변화가 일어나고 있음을 시사하는 초기 데이터가 충분합니다. 우리가 모르는 것, 그리고 이제 중요한 질문이 된 것은 다음과 같습니다. 이 시장에서 어디에서 가치가 발생할까요?

지난 한 해 동안 우리는 제너레이티브 AI를 직접 다루는 수십 명의 스타트업 창업자 및 대기업 운영자를 만났습니다. 우리는 그것을 관찰했습니다 인프라 벤더 지금까지 이 시장에서 가장 큰 승자가 될 가능성이 높으며 스택을 통해 흐르는 달러의 대부분을 차지합니다. 응용 회사 매출이 매우 빠르게 증가하고 있지만 유지, 제품 차별화 및 총 마진으로 어려움을 겪는 경우가 많습니다. 그리고 대부분 모델 제공자, 이 시장의 존재 자체에 책임이 있지만 아직 큰 상업적 규모를 달성하지 못했습니다.

다시 말해, 가장 큰 가치를 창출하는 기업, 즉 생성적 AI 모델을 교육하고 이를 새로운 앱에 적용하는 기업은 대부분의 가치를 포착하지 못했습니다. 다음에 일어날 일을 예측하는 것은 훨씬 어렵습니다. 그러나 이해해야 할 핵심 사항은 스택의 어떤 부분이 진정으로 차별화되고 방어 가능한지입니다. 이는 시장 구조(예: 수평적 대 수직적 회사 개발)와 장기적인 가치 동인(예: 마진 및 보유)에 큰 영향을 미칠 것입니다. 지금까지 우리는 구조적 방어 가능성을 찾는 데 어려움을 겪었습니다. 어딘가에 기존 기업을 위한 전통적인 해자 외부의 스택에 있습니다.

우리는 제너레이티브 AI에 대해 믿을 수 없을 정도로 낙관적이며 그것이 소프트웨어 산업과 그 이상에 막대한 영향을 미칠 것이라고 믿습니다. 이 게시물의 목표는 시장의 역학 관계를 파악하고 생성 AI 비즈니스 모델에 대한 광범위한 질문에 답하기 시작하는 것입니다.

높은 수준의 기술 스택: 인프라, 모델 및 앱

제너레이티브 AI 시장이 어떻게 형성되고 있는지 이해하려면 먼저 오늘날 스택이 어떻게 보이는지 정의해야 합니다. 여기에 우리의 예비 견해가 있습니다.

스택은 세 개의 레이어로 나눌 수 있습니다.

  • 어플리케이션 자체 모델 파이프라인("엔드 투 엔드 앱")을 실행하거나 타사 API에 의존하여 생성 AI 모델을 사용자 대면 제품에 통합합니다.
  • 모델 독점 API 또는 오픈 소스 체크포인트(호스팅 솔루션이 필요함)로 제공되는 AI 제품에 전원을 공급합니다.
  • 인프라 제너레이티브 AI 모델을 위한 교육 및 추론 워크로드를 실행하는 공급업체(예: 클라우드 플랫폼 및 하드웨어 제조업체)

중요한 점: 이것은 시장 지도가 아니라 시장을 분석하기 위한 프레임워크입니다. 각 범주에서 잘 알려진 공급업체의 몇 가지 예를 나열했습니다. 출시된 모든 놀라운 생성 AI 애플리케이션을 포괄적으로 나열하거나 나열하려는 시도는 하지 않았습니다. 또한 아직 고도로 표준화되지 않은 MOps 또는 LLMops 도구에 대해서는 여기서 자세히 다루지 않을 것이며 향후 게시물에서 다룰 것입니다.

제너레이티브 AI 앱의 첫 번째 물결이 규모에 도달하기 시작했지만 유지 및 차별화에 어려움을 겪고 있습니다.

이전 기술 주기에서 일반적인 통념은 크고 독립적인 회사를 구축하려면 개인 소비자를 의미하든 B2B 구매자를 의미하든 최종 고객을 소유해야 한다는 것이었습니다. 제너레이티브 AI 분야에서 가장 큰 회사가 최종 사용자 애플리케이션이 될 것이라고 믿고 싶은 유혹이 듭니다. 지금까지는 그것이 사실인지 명확하지 않습니다.

확실히 제너레이티브 AI 애플리케이션의 성장은 엄청난 참신함과 수많은 사용 사례에 힘입어 엄청나게 성장했습니다. 실제로 우리는 이미지 생성, 카피라이팅 및 코드 작성과 같이 이미 연간 수익이 100억 달러를 초과한 제품 카테고리를 최소 XNUMX개 이상 알고 있습니다.

그러나 성장만으로는 내구성 있는 소프트웨어 회사를 구축하기에 충분하지 않습니다. 결정적으로 성장은 수익성이 있어야 합니다. 즉, 사용자와 고객이 일단 가입하면 이익을 창출하고(높은 총 마진) 오랫동안 유지(높은 유지율)한다는 점에서 성장은 수익성이 있어야 합니다. 강력한 기술적 차별화가 없는 상황에서 B2B 및 B2C 앱은 네트워크 효과, 데이터 유지 또는 점점 더 복잡해지는 워크플로 구축을 통해 장기적인 고객 가치를 창출합니다.

생성 AI에서 이러한 가정이 반드시 맞는 것은 아닙니다. 우리가 이야기한 앱 회사 전체에 걸쳐 광범위한 총 마진이 있습니다. 어떤 경우에는 90%까지 높지만 대부분 모델 추론 비용으로 인해 50-60%까지 낮습니다. 퍼널 상단의 성장은 놀라웠지만 현재의 고객 확보 전략이 확장 가능한지는 불분명합니다. 이미 유료 확보 효과와 유지율이 감소하기 시작하고 있습니다. 또한 많은 앱은 유사한 기본 AI 모델에 의존하고 경쟁업체가 복제하기 어려운 명백한 네트워크 효과 또는 데이터/워크플로우를 발견하지 못했기 때문에 상대적으로 차별화되지 않았습니다.

따라서 최종 사용자 앱을 판매하는 것이 지속 가능한 제너레이티브 AI 비즈니스를 구축하는 유일한 방법 또는 최선의 방법인지는 아직 명확하지 않습니다. 언어 모델의 경쟁과 효율성이 증가함에 따라 마진이 개선되어야 합니다(자세한 내용은 아래 참조). AI 관광객이 시장을 떠나면서 리텐션이 증가해야 합니다. 그리고 수직적으로 통합된 앱이 차별화를 추진하는 데 이점이 있다는 강력한 주장이 있습니다. 하지만 아직 증명해야 할 것이 많습니다.

앞을 내다보면 생성 AI 앱 회사가 직면한 몇 가지 중요한 질문은 다음과 같습니다.

  • 수직 통합("모델 + 앱"). AI 모델을 서비스로 사용하면 앱 개발자가 소규모 팀과 빠르게 반복하고 기술이 발전함에 따라 모델 공급자를 교체할 수 있습니다. 반대로 일부 개발자는 제품이 is 즉, 독점적인 제품 데이터에 대한 지속적인 재교육을 통해 방어력을 생성하는 유일한 방법입니다. 그러나 훨씬 더 높은 자본 요구 사항과 덜 민첩한 제품 팀 비용이 발생합니다.
  • 기능 대 앱 구축. 생성 AI 제품은 데스크톱 앱, 모바일 앱, Figma/Photoshop 플러그인, Chrome 확장 프로그램, 심지어 Discord 봇까지 다양한 형태를 취합니다. UI는 일반적으로 텍스트 상자에 불과하기 때문에 사용자가 이미 작업 중인 AI 제품을 쉽게 통합할 수 있습니다. 이들 중 어느 것이 독립 기업이 될 것이며, 이미 제품 라인에 AI를 통합한 Microsoft 또는 Google과 같은 기존 기업에 의해 흡수될 것입니까?
  • 하이프 사이클을 통한 관리. 이탈이 현재의 제너레이티브 AI 제품 배치에 내재되어 있는지, 아니면 초기 시장의 인공물인지는 아직 명확하지 않습니다. 또는 과대 광고가 가라앉으면서 생성 AI에 대한 관심 급증이 줄어들 수도 있습니다. 이러한 질문은 언제 자금 조달에 가속 페달을 밟아야 하는지를 포함하여 앱 회사에 중요한 영향을 미칩니다. 고객 확보에 얼마나 적극적으로 투자할 것인지; 우선 순위를 지정할 사용자 세그먼트 제품 시장 적합성을 선언할 시기.

모델 공급자는 생성 AI를 발명했지만 대규모 상업적 규모에 도달하지 못했습니다.

우리가 현재 생성 AI라고 부르는 것은 Google, OpenAI 및 Stability와 같은 곳에서 수행된 뛰어난 연구 및 엔지니어링 작업 없이는 존재하지 않았을 것입니다. 참신한 모델 아키텍처와 훈련 파이프라인을 확장하기 위한 영웅적인 노력을 통해 우리 모두는 현재 대규모 언어 모델(LLM) 및 이미지 생성 모델의 놀라운 기능을 활용할 수 있습니다.

그러나 이러한 회사와 관련된 수익은 사용 및 버즈에 비해 여전히 상대적으로 적습니다. 이미지 생성에서 Stable Diffusion은 사용자 인터페이스, 호스팅된 제품 및 미세 조정 방법의 에코시스템을 통해 폭발적인 커뮤니티 성장을 보였습니다. 그러나 안정성은 비즈니스의 핵심 원칙으로 주요 체크포인트를 무료로 제공합니다. 자연어 모델에서 OpenAI는 GPT-3/3.5 및 ChatGPT를 압도합니다. 하지만 상대적으로 OpenAI를 기반으로 구축된 킬러 앱은 지금까지 거의 존재하지 않으며 가격은 이미 한 번 떨어졌다.

이는 일시적인 현상일 수 있습니다. Stability는 아직 수익 창출에 집중하지 않은 새로운 회사입니다. OpenAI는 더 많은 킬러 앱이 구축됨에 따라 모든 NLP 범주 수익의 상당 부분을 벌어들이는 대규모 비즈니스가 될 가능성이 있습니다. Microsoft의 제품 포트폴리오에 통합 순조롭게 진행됩니다. 이러한 모델의 엄청난 사용을 감안할 때 대규모 수익은 그다지 뒤처지지 않을 수 있습니다.

그러나 이에 대항하는 세력도 있다. 오픈 소스로 공개된 모델은 대규모 모델 교육과 관련된 비용(최대 수천만 또는 수억 달러)을 부담하지 않는 외부 회사를 포함하여 누구나 호스팅할 수 있습니다. 그리고 클로즈드 소스 모델이 엣지를 무한정 유지할 수 있는지는 확실하지 않습니다. 예를 들어 Anthropic, Cohere 및 Character.ai와 같은 회사에서 구축한 LLM이 유사한 데이터 세트(예: 인터넷) 및 유사한 모델 아키텍처에서 훈련된 OpenAI 수준의 성능에 더 가까워지는 것을 보기 시작했습니다. 안정적인 확산의 예는 다음을 제안합니다. if 오픈 소스 모델이 충분한 수준의 성능과 커뮤니티 지원에 도달하면 독점 대안이 경쟁하기 어려울 수 있습니다.

아마도 지금까지 모델 제공업체에 대한 가장 분명한 교훈은 상용화가 호스팅과 연결될 가능성이 높다는 것입니다. 독점 API(예: OpenAI)에 대한 수요가 빠르게 증가하고 있습니다. 오픈 소스 모델을 위한 호스팅 서비스(예: Hugging Face 및 Replicate)는 모델을 쉽게 공유하고 통합할 수 있는 유용한 허브로 부상하고 있으며 모델 생산자와 소비자 간에 간접적인 네트워크 효과도 있습니다. 기업 고객과의 미세 조정 및 호스팅 계약을 통해 수익 창출이 가능하다는 강력한 가설도 있습니다.

그 외에도 모델 공급자가 직면한 몇 가지 중요한 질문이 있습니다.

  • 상품화. AI 모델이 시간이 지남에 따라 성능 면에서 수렴될 것이라는 일반적인 믿음이 있습니다. 앱 개발자들과 이야기해 보면 텍스트와 이미지 모델 모두에서 강력한 리더가 있기 때문에 아직 일어나지 않은 일이 분명합니다. 그들의 장점은 고유한 모델 아키텍처가 아니라 높은 자본 요구 사항, 독점 제품 상호 작용 데이터 및 부족한 AI 인재를 기반으로 합니다. 이것이 지속 가능한 이점으로 작용할까요?
  • 졸업 위험. 모델 공급자에 의존하는 것은 앱 회사가 시작하고 비즈니스를 성장시키는 좋은 방법입니다. 그러나 규모에 도달하면 자체 모델을 구축 및/또는 호스팅할 인센티브가 있습니다. 그리고 많은 모델 제공업체는 고객 분포가 매우 편향되어 있으며 소수의 앱이 수익의 대부분을 차지합니다. 이러한 고객이 사내 AI 개발로 전환하면 어떻게 됩니까?
  • 돈이 중요해? 제너레이티브 AI의 가능성은 매우 크고 잠재적으로 매우 해로울 수 있기 때문에 많은 모델 제공업체가 공익 기업(B Corps)으로 조직하거나 상한선이 있는 이익 공유를 발행하거나 공익을 그들의 임무에 명시적으로 통합했습니다. 이것은 그들의 모금 노력을 전혀 방해하지 않았습니다. 그러나 대부분의 모델 공급자가 실제로 필요 가치를 포착하고 필요한 경우.

인프라 공급업체는 모든 것을 만지고 보상을 얻습니다.

제너레이티브 AI의 거의 모든 것이 어느 시점에서 클라우드 호스팅 GPU(또는 TPU)를 통과합니다. 교육 워크로드를 실행하는 모델 제공자/연구실, 추론/미세 조정을 실행하는 호스팅 회사 또는 두 가지를 모두 수행하는 응용 프로그램 회사를 위해 — 플롭 제너레이티브 AI의 생명줄입니다. 매우 오랜 시간 동안 처음으로 가장 파괴적인 컴퓨팅 기술의 발전이 대규모로 계산되었습니다.

결과적으로 생성 AI 시장의 많은 돈이 궁극적으로 인프라 회사로 흘러갑니다. 일부를 넣기 위해 대단히 대략적인 수치: 평균적으로 앱 회사는 추론 및 고객별 미세 조정에 매출의 약 20~40%를 지출하는 것으로 추정됩니다. 이것은 일반적으로 컴퓨팅 인스턴스를 위해 클라우드 제공자에게 직접 지불되거나 제10자 모델 제공자에게 지불되며, 이들은 결국 수익의 약 절반을 클라우드 인프라에 지출합니다. 따라서 20~XNUMX%로 추측하는 것이 합리적입니다. 총 수익 생성 AI에서 오늘날 클라우드 제공업체로 이동합니다.

게다가 자체 모델을 교육하는 스타트업은 수십억 달러의 벤처 자본을 모금했으며, 그 중 대부분(초기 라운드에서 최대 80~90%)은 일반적으로 클라우드 제공업체와 함께 사용됩니다. 많은 공공 기술 회사는 외부 클라우드 공급자 또는 하드웨어 제조업체와 직접 모델 교육에 연간 수억 달러를 지출합니다.

이것은 특히 초기 시장의 경우 기술적인 용어로 "많은 돈"이라고 부르는 것입니다. 그것의 대부분은에서 소비됩니다 큰 3 클라우드: Amazon Web Services(AWS), Google Cloud Platform(GCP) 및 Microsoft Azure. 이러한 클라우드 제공자는 총체적으로 이상 지출 연간 $ 100 억 가장 포괄적이고 신뢰할 수 있으며 비용 경쟁력 있는 플랫폼을 확보하기 위해 자본 지출에서. 특히 생성 AI에서는 희소한 하드웨어(예: Nvidia A100 및 H100 GPU)에 우선적으로 액세스할 수 있기 때문에 공급 제약의 이점도 있습니다.

하지만 흥미롭게도 신뢰할 수 있는 경쟁이 등장하기 시작했습니다. 오라클과 같은 도전자들은 막대한 자본 지출과 판매 인센티브로 시장에 진출했습니다. 그리고 Coreweave 및 Lambda Labs와 같은 몇몇 신생 기업은 특히 대규모 모델 개발자를 대상으로 하는 솔루션으로 빠르게 성장했습니다. 그들은 비용, 가용성 및 맞춤형 지원에서 경쟁합니다. 또한 더 세분화된 리소스 추상화(예: 컨테이너)를 노출하는 반면, 대규모 클라우드는 GPU 가상화 제한으로 인해 VM 인스턴스만 제공합니다.

대부분의 AI 워크로드를 실행하는 배후에는 아마도 지금까지 생성 AI에서 가장 큰 승자일 것입니다. 바로 Nvidia입니다. 그 회사 보고된 $3.8 십억 2023 회계연도 XNUMX분기 데이터 센터 GPU 매출의, 생성 AI 사용 사례에 대한 의미 있는 부분을 포함합니다. 그리고 그들은 GPU 아키텍처에 대한 수십 년간의 투자, 강력한 소프트웨어 생태계 및 학계에서의 깊은 사용을 통해 이 사업을 중심으로 강력한 해자를 구축했습니다. 최근 분석 Nvidia GPU가 최고의 AI 칩 스타트업을 합친 것보다 90배 더 많이 연구 논문에 인용된 것으로 나타났습니다..

Google Tensor Processing Unit(TPU)을 포함한 다른 하드웨어 옵션이 존재합니다. AMD 인스팅트 GPU; AWS Inferentia 및 Trainium 칩, Cerebras, Sambanova 및 Graphcore와 같은 신생 기업의 AI 가속기. 게임에 뒤처진 인텔도 고급 Habana 칩과 Ponte Vecchio GPU로 시장에 진입하고 있습니다. 그러나 지금까지 이러한 새로운 칩 중 상당한 시장 점유율을 차지한 칩은 거의 없습니다. 주목해야 할 두 가지 예외는 TPU가 Stable Diffusion 커뮤니티와 일부 대규모 GCP 거래에서 견인력을 얻은 Google과 TSMC입니다. 모든 Nvidia GPU를 포함하여 여기에 나열된 칩 중 인텔은 자체 팹과 TSMC를 혼합하여 칩을 만듭니다.

즉, 인프라는 스택에서 수익성이 있고 내구성이 있으며 겉보기에 방어 가능한 레이어입니다. 인프라 기업이 답해야 할 주요 질문은 다음과 같습니다.

  • 상태 비저장 워크로드를 유지합니다. Nvidia GPU는 어디에서 대여하든 동일합니다. 대부분의 AI 워크로드는 모델 추론에 연결된 데이터베이스나 스토리지가 필요하지 않다는 점에서 상태 비저장입니다(모델 가중치 자체 제외). 이는 AI 워크로드가 기존 애플리케이션 워크로드보다 클라우드 간에 더 쉽게 이동할 수 있음을 의미합니다. 이러한 맥락에서 클라우드 공급자는 어떻게 끈기를 만들고 고객이 가장 저렴한 옵션으로 이동하는 것을 방지할 수 있습니까?
  • 칩 부족의 끝에서 살아남기. 클라우드 공급자와 Nvidia 자체에 대한 가격은 가장 바람직한 GPU의 부족한 공급으로 지원되었습니다. 한 공급업체는 A100s의 정가가 실제로 증가 컴퓨팅 하드웨어에서는 매우 이례적인 일입니다. 생산량 증가 및/또는 새로운 하드웨어 플랫폼 채택을 통해 이러한 공급 제약이 궁극적으로 제거되면 클라우드 공급자에게 어떤 영향을 미칩니까?
  • 챌린저 클라우드가 돌파할 수 있을까요? 우리는 강한 신자입니다. 수직 구름 보다 전문화된 제품으로 Big 3에서 시장 점유율을 차지할 것입니다. 지금까지 AI에서 도전자들은 적당한 기술 차별화와 Nvidia의 지원을 통해 의미 있는 견인력을 확보했습니다. Nvidia의 경우 기존 클라우드 제공업체가 가장 큰 고객이자 신흥 경쟁자입니다. 장기적인 질문은 이것이 Big 3의 규모 이점을 극복하기에 충분할까요?

그래서… 어디에서 가치가 발생할까요?

물론 우리는 아직 모릅니다. 그러나 생성 AI에 대한 초기 데이터를 기반으로 초기 AI/ML 회사에 대한 우리의 경험, 우리의 직감은 다음과 같습니다. 

오늘날 생성 AI에는 체계적 해자가 없는 것으로 보입니다. XNUMX차 근사치로서 애플리케이션은 유사한 모델을 사용하기 때문에 강력한 제품 차별화가 부족합니다. 모델은 유사한 아키텍처를 가진 유사한 데이터 세트에서 훈련되었기 때문에 불분명한 장기적 차별화에 직면합니다. 클라우드 공급자는 동일한 GPU를 실행하기 때문에 깊은 기술적 차별화가 부족합니다. 하드웨어 회사도 동일한 팹에서 칩을 제조합니다.

물론 표준 해자가 있습니다. 규모 해자("나는 당신보다 더 많은 돈을 가지고 있거나 모을 수 있습니다!"), 공급망 해자("나는 GPU가 있지만 당신은 없습니다!"), 생태계 해자(" 모두가 이미 내 소프트웨어를 사용하고 있습니다!"), 알고리즘 해자("우리가 당신보다 더 영리합니다!"), 배포 해자("나는 이미 영업 팀이 있고 당신보다 더 많은 고객이 있습니다!") 및 데이터 파이프라인 해자("I' 당신보다 더 많은 인터넷을 크롤링했습니다!”). 그러나 이러한 해자 중 어느 것도 장기적으로 내구성이 있는 경향이 없습니다. 그리고 강력하고 직접적인 네트워크 효과가 스택의 모든 계층에서 유지되고 있는지 말하기에는 너무 이릅니다.

사용 가능한 데이터에 따르면 생성 AI에서 장기적인 승자 독식 역학이 있는지는 확실하지 않습니다.

이상하다. 그러나 우리에게는 좋은 소식입니다. 이 시장의 잠재적 규모는 파악하기 어렵습니다. 모든 소프트웨어인간의 모든 노력 — 그래서 우리는 스택의 모든 수준에서 많은 플레이어와 건전한 경쟁을 기대합니다. 우리는 또한 최종 시장과 최종 사용자가 지시하는 최선의 접근 방식을 통해 수평적 기업과 수직적 기업이 모두 성공할 것으로 기대합니다. 예를 들어 최종 제품의 주요 차별화 요소가 AI 자체인 경우 수직화(즉, 사용자 대면 앱을 자체 제작 모델에 긴밀하게 연결)가 승리할 가능성이 높습니다. 반면 AI가 더 큰 롱테일 기능 세트의 일부인 경우 수평화가 발생할 가능성이 더 큽니다. 물론 시간이 지남에 따라 보다 전통적인 해자가 건설되는 것을 볼 수 있으며 새로운 유형의 해자가 자리를 잡는 것을 볼 수도 있습니다.

어떤 경우이든 우리가 확신하는 한 가지는 생성 AI가 게임을 바꾼다는 것입니다. 우리는 모두 실시간으로 규칙을 배우고 있으며 엄청난 양의 가치가 잠금 해제될 것이며 그 결과 기술 환경이 훨씬 더 달라 보일 것입니다. 그리고 우리는 그것을 위해 여기 있습니다!

이 게시물의 모든 이미지는 Midjourney를 사용하여 생성되었습니다.

spot_img

최신 인텔리전스

spot_img