제퍼넷 로고

기업에서 생성적 AI를 다시 생각해야 할 때인 이유 – DATAVERSITY

시간

최근 GenAI(제너레이티브 AI) 기술의 발전을 주시해 왔다면 GenAI 모델의 작동 방식, 프롬프트 작성 기술, GenAI 모델이 의존하는 데이터 유형 등 핵심 개념에 익숙할 것입니다. .

GenAI 내의 이러한 기본 구성 요소는 일정하게 유지되지만 적용 방식은 변화하고 있습니다. 2022년 말 ChatGPT의 부상으로 주목을 받은 GenAI에 대한 접근 방식은 기업이 GenAI를 활용하여 새로운 비즈니스 기능을 활성화할 때 채택할 접근 방식과 동일하지 않을 것입니다.

생성 AI를 둘러싼 이러한 개념이 어떻게 진화하고 있는지, 그리고 이러한 변화가 비즈니스 세계에서 GenAI의 미래에 어떤 의미를 갖는지 살펴보겠습니다.

생성 AI에 대한 전통적인 접근 방식

GenAI의 핵심 요소는 다음과 같이 요약될 수 있습니다.

  • 재단 모델: 기초 모델은 다양한 용도를 지원할 수 있는 GenAI 모델입니다. 현재까지 OpenAI에서 개발한 GPT 모델과 같은 소수의 GenAI 모델이 이 공간을 지배해 왔습니다.
  • 날짜 : 모델은 학습 목적으로 데이터를 사용합니다. 전통적으로 해당 데이터는 대부분 다음과 같은 형식을 취했습니다. 비정형 데이터OpenAI와 같은 기반 모델 공급업체는 모델을 대중에게 공개하기 전에 사전 훈련하는 데 사용했습니다.
  • 신속한 엔지니어링: 프롬프트 엔지니어링은 GenAI 모델에서 적절한 응답을 생성하는 프롬프트를 고안하는 프로세스입니다. 사전 학습된 기초 모델을 사용한다고 해서 해당 모델의 데이터나 컨텍스트를 맞춤화할 수 있는 기회가 많지 않기 때문에 AI 모델이 특정 사용 사례를 지원하도록 하려면 신속한 엔지니어링이 중요했습니다. 데이터나 모델 자체를 제어할 수는 없지만 모델에 제공되는 프롬프트는 제어할 수 있습니다.

간단히 말해서, 지난 1년 반 동안 GenAI 생태계는 맞춤형 프롬프트 엔지니어링에 크게 의존하는 사용 사례를 해결하기 위해 일반 비정형 데이터 세트로 사전 훈련된 타사 기반 모델에 의해 지배되었습니다. 이 세계에서 기초 모델을 구축한 공급업체는 본질적으로 문지기였습니다. 모델 작동 방식과 훈련한 데이터에 대한 결정이 모델 사용 방법에 대한 제약 조건을 설정하기 때문입니다.

엔터프라이즈 생성 AI의 혁신

미래를 내다보면 이러한 접근 방식은 몇 가지 주요 방식으로 변화할 준비가 되어 있습니다.

1. 맞춤형 기초 모델

가장 큰 변화 중 하나는 생성 AI 서비스 전문 기업이 제공하는 모델을 넘어서는 기반 모델의 가용성이 증가하고 있다는 것입니다.

Meta 및 Google과 같은 회사에서 출시한 오픈 소스 모델 외에도 이제 SAP와 같은 공급업체가 자체 기반 모델을 개발하는 모습을 볼 수 있습니다. 결정적으로 이러한 모델은 모델이 작동하는 상황을 제어하기 위해 자체 매개변수를 주입함으로써 기업이 모델 운영을 맞춤화할 수 있는 더 큰 기회를 제공할 것입니다. 경우에 따라 사용자 정의 데이터를 기반으로 모델을 학습하거나 재학습할 수도 있습니다.

여기서 중요한 점은 차세대 기반 모델을 통해 기업이 생성 AI를 활용하는 방법을 훨씬 더 세밀하게 제어할 수 있다는 것입니다. 더 이상 특정 사용 사례에 맞게 설계되지 않은 일반 모델에 안주해서는 안 됩니다. 대신 데이터 엔지니어링 기능이 있는 경우 광범위한 방식으로 모델 동작을 사용자 정의할 수 있습니다.

2. 구조화된 데이터의 활용

역사적으로 GenAI 모델은 주로 문서 및 웹 페이지와 같은 구조화되지 않은 데이터에 대해 교육했습니다. 모델 설계자의 주요 목표는 사용자가 해당 문서 내의 데이터를 검색하거나 요약할 수 있도록 하는 것이었기 때문입니다. 기본적으로 OpenAI에서 개발한 것과 같은 GenAI 모델은 웹용 대체 검색 인터페이스입니다.

이는 비즈니스 내에서 GenAI의 중요한 사용 사례 중 하나로 남아 있습니다. 추가적으로 떠오르는 사용 사례는 데이터베이스에 저장된 정보와 같은 구조화된 데이터를 쿼리하기 위한 인터페이스로 GenAI를 활용하는 것입니다. 기업에서는 Amazon Q와 같은 솔루션을 사용하여 이미 이 작업을 수행할 수 있습니다.

이는 GenAI가 보유하고 있는 방대한 양의 구조화된 데이터를 해석하는 기업의 능력을 향상시킬 수 있음을 나타내기 때문에 중요합니다. 과거에는 이 데이터를 기반으로 질문을 해결하려면 복잡한 쿼리를 직접 작성한 다음 보고서를 생성하는 전문 데이터 분석가가 필요했습니다. 이제 GenAI는 가장 숙련된 데이터 분석가가 달성할 수 있는 것보다 훨씬 빠른 속도로 해당 작업을 수행할 수 있습니다.

3. 데이터 디스패처의 출현

비즈니스에 존재하는 모든 데이터와 AI 모델을 통합하는 것은 복잡한 작업입니다. 특히 어떤 데이터 세트가 특정 사용 사례에 가장 관련성이 있는지 불분명한 경우가 많기 때문입니다. 예를 들어 판매 데이터를 쿼리할 때 ERP 시스템, CRM, 수동으로 준비된 스프레드시트 등의 데이터를 사용하여 모델에 메시지를 표시해야 합니까?

이 문제를 해결하기 위해 기업은 제가 "데이터 디스패처"라고 부르는 것을 채택할 가능성이 높습니다. 데이터 디스패처는 효율적인 방식으로 GenAI 서비스에 데이터를 효율적으로 노출하는 통합 도구로, 기업이 사용자 지정 모델 교육을 위해 데이터를 쉽게 활용할 수 있도록 해줍니다. 기업이 AI 훈련에 필요한 데이터를 결정하도록 강요하는 대신 데이터 디스패처에게 이 작업을 처리하도록 맡길 것입니다.

이는 데이터 디스패처 공급업체가 GenAI 환경의 새로운 문지기가 될 수 있는 위치에 놓이게 합니다. AI 모델을 개발하는 공급업체에서 프롬프트를 지원하는 데 사용할 수 있는 데이터에 영향을 미치는 공급업체로 권력이 옮겨갈 것입니다.

민주화된 데이터 중심 GenAI 환경을 향하여?

궁극적으로 이미 진행 중인 이러한 변화는 기업이 GenAI를 사용하는 방법을 정확히 더 잘 제어할 수 있다는 점에서 GenAI를 더욱 민주적으로 만들 것을 약속합니다.

동시에 데이터, 특히 특정 기업이 소유한 독점 데이터를 그 어느 때보다 중요하게 만듭니다. 소수의 AI 모델 공급업체와 그들이 훈련하기로 결정한 데이터에 얽매이지 않고, 기업은 데이터 디스패처의 도움을 받아 어떤 정보가 GenAI 도구와 서비스를 가능하게 할지 결정하게 됩니다.

이 멋진 신세계에서 성공하려면 데이터를 효과적으로 관리하고 통제하는 능력이 핵심이 될 것입니다. 데이터 관리 오랫동안 기업에 중요했지만 기업이 GenAI와 관련된 새로운 기회를 활용하려면 기업이 이를 사용하여 맞춤형 GenAI 사용 사례를 지원할 수 있도록 전례 없는 수준의 데이터 제어가 필요합니다. 

그 논의는 현재 진행 중이며 앞으로 몇 달, 몇 년 동안 모니터링하는 데 핵심이 될 것입니다.

spot_img

최신 인텔리전스

spot_img