제퍼넷 로고

LLM에서 기업 지식 그래프의 역할

시간

개요

대규모 언어 모델 (LLM) 및 생성 AI(Generative AI)는 인공 지능 및 자연어 처리 분야의 혁신적인 혁신을 나타냅니다. 인간의 언어를 이해하고 생성할 수 있으며 텍스트, 이미지, 오디오 및 합성 데이터와 같은 콘텐츠를 생성할 수 있으므로 다양한 응용 분야에서 활용도가 높습니다. 생성적 AI는 콘텐츠 생성을 자동화 및 향상하고, 사용자 경험을 개인화하고, 워크플로우를 간소화하고, 창의성을 육성함으로써 실제 애플리케이션에서 엄청난 중요성을 갖습니다. 이 글에서는 Enterprise Knowledge Graph를 사용하여 프롬프트를 효과적으로 기반으로 기업이 Open LLM과 통합할 수 있는 방법에 중점을 둘 것입니다.

학습 목표

  • LLM/Gen-AI 시스템과 상호 작용하면서 접지 및 프롬프트 구축에 대한 지식을 습득합니다.
  • Grounding의 엔터프라이즈 관련성을 이해하고 개방형 Gen-AI 시스템과의 통합을 통한 비즈니스 가치를 예를 들어 설명합니다.
  • 두 가지 주요 접지 경합 솔루션 지식 그래프와 벡터 스토어를 다양한 측면에서 분석하고 어느 것이 적합한지 이해합니다.
  • 개인화된 추천 고객 시나리오를 위해 기초 및 신속한 구축, 지식 그래프 활용, 학습 데이터 모델링 및 JAVA 그래프 모델링의 샘플 엔터프라이즈 설계를 연구합니다.

이 기사는 데이터 과학 Blogathon.

차례

대형 언어 모델이란 무엇입니까?

대규모 언어 모델은 방대한 양의 텍스트|비정형 데이터에 대해 딥 러닝 기술을 사용하여 훈련된 고급 AI 모델입니다. 이러한 모델은 인간의 언어와 상호 작용하고 인간과 유사한 텍스트, 이미지 및 오디오를 생성하고 다양한 작업을 수행할 수 있습니다. 자연어 처리 작업.

대조적으로, 언어 모델의 정의는 텍스트 말뭉치 분석을 기반으로 단어 시퀀스에 확률을 할당하는 것을 의미합니다. 언어 모델은 단순한 n-gram 모델부터 보다 정교한 신경망 모델까지 다양할 수 있습니다. 그러나 "대규모 언어 모델"이라는 용어는 일반적으로 딥 러닝 기술을 사용하고 수백만에서 수십억에 이르는 많은 수의 매개변수를 갖는 모델을 의미합니다. 이러한 모델은 언어의 복잡한 패턴을 포착하고 인간이 작성한 텍스트와 종종 구별할 수 없는 텍스트를 생성할 수 있습니다.

프롬프트란 무엇입니까?

LLM 또는 유사한 챗봇 AI 시스템에 대한 프롬프트는 AI와의 대화 또는 상호 작용을 시작하기 위해 제공하는 텍스트 기반 입력 또는 메시지입니다. LLM은 다재다능하고 다양한 빅 데이터로 훈련되었으며 다양한 작업에 사용될 수 있습니다. 따라서 프롬프트의 맥락, 범위, 품질 및 명확성은 LLM 시스템에서 받는 응답에 큰 영향을 미칩니다.

접지/RAG란 무엇입니까?

자연어 LLM 처리의 맥락에서 RAG(검색 증강 생성)인 접지는 보다 맞춤화되고 정확한 응답을 개선하고 검색하기 위해 LLM에 제공하는 컨텍스트, 추가 메타데이터 및 범위로 프롬프트를 강화하는 것을 의미합니다. 이러한 연결은 AI 시스템이 필요한 범위와 컨텍스트에 맞는 방식으로 데이터를 이해하고 해석하는 데 도움이 됩니다. LLM에 대한 연구에 따르면 응답 품질은 프롬프트의 품질에 따라 달라집니다.

이는 원시 데이터와 인간의 이해 및 범위가 지정된 컨텍스트에 일치하는 방식으로 해당 데이터를 처리하고 해석하는 AI 능력 간의 격차를 해소하므로 AI의 기본 개념입니다. 이는 AI 시스템의 품질과 신뢰성을 향상시키고 정확하고 유용한 정보나 응답을 제공하는 능력을 향상시킵니다.

LLM의 단점은 무엇입니까?

GPT-3과 같은 LLM(대형 언어 모델)은 다양한 응용 프로그램에서 상당한 관심과 사용을 얻었지만 몇 가지 단점이나 단점도 있습니다. LLM의 주요 단점 중 일부는 다음과 같습니다.

1. 편견과 공정성: LLM은 훈련 데이터로부터 편향을 상속받는 경우가 많습니다. 이로 인해 편견 또는 차별적인 콘텐츠가 생성될 수 있으며, 이는 유해한 고정관념을 강화하고 기존 편견을 영속시킬 수 있습니다.

2. 환각: LLM은 자신이 생성하는 콘텐츠를 실제로 이해하지 못합니다. 훈련 데이터의 패턴을 기반으로 텍스트를 생성합니다. 이는 사실적으로 부정확하거나 무의미한 정보를 생성할 수 있어 의료 진단이나 법적 조언과 같은 중요한 응용 프로그램에 적합하지 않을 수 있음을 의미합니다.

3. 전산 자원: LLM을 교육하고 실행하려면 GPU 및 TPU와 같은 특수 하드웨어를 포함하여 막대한 컴퓨팅 리소스가 필요합니다. 이로 인해 개발 및 유지 관리 비용이 많이 듭니다.

4. 데이터 프라이버시 및 보안: LLM은 텍스트, 이미지, 오디오 등 설득력 있는 가짜 콘텐츠를 생성할 수 있습니다. 이는 사기성 콘텐츠를 생성하거나 개인을 사칭하는 데 악용될 수 있으므로 데이터 개인정보 보호 및 보안에 위험을 초래합니다.

5. 윤리적 문제: 딥페이크 또는 자동화된 콘텐츠 생성과 같은 다양한 응용 프로그램에서 LLM을 사용하면 오용 가능성과 사회에 미치는 영향에 대한 윤리적 질문이 제기됩니다.

6. 규제 문제: LLM 기술의 급속한 발전은 규제 프레임워크를 앞질러 LLM과 관련된 잠재적인 위험과 과제를 해결하기 위한 적절한 지침과 규정을 수립하는 것을 어렵게 만들고 있습니다.

이러한 단점 중 다수는 LLM에 내재된 것이 아니라 개발, 배포 및 사용 방법을 반영한다는 점에 유의하는 것이 중요합니다. 이러한 단점을 완화하고 LLM을 사회에 더 책임감 있고 유익하게 만들기 위한 노력이 계속되고 있습니다. 여기가 접지 및 마스킹이 활용될 수 있고 기업에 큰 이점이 될 수 있는 곳입니다.

접지의 기업 관련성

기업은 업무상 중요한 애플리케이션에 LLM(대형 언어 모델)을 도입하는 데 성공하고 있습니다. 그들은 LLM이 다양한 영역에서 이익을 얻을 수 있는 잠재적인 가치를 이해합니다. LLM 구축, 사전 훈련 및 미세 조정은 비용이 많이 들고 번거롭습니다. 오히려 기업 사용 사례에 대한 프롬프트를 접지하고 마스킹하면서 업계에서 사용할 수 있는 개방형 AI 시스템을 사용할 수 있습니다.

따라서 접지는 기업의 주요 고려 사항이며 응답 품질을 향상하고 환각, 데이터 보안 및 규정 준수에 대한 우려를 극복하는 데 더 관련성이 높고 도움이 됩니다. 이는 놀라운 비즈니스 가치를 공개적으로 이끌어 낼 수 있기 때문입니다. 현재 자동화에 어려움을 겪고 있는 다양한 사용 사례에 대해 LLM이 시장에 나와 있습니다.

 기업에 대한 이점

기업이 LLM을 사용하여 접지를 구현하면 다음과 같은 몇 가지 이점이 있습니다.

1. 향상된 신뢰성: LLM이 생성한 정보와 콘텐츠가 검증된 데이터 소스에 기반을 두고 있는지 확인함으로써 기업은 커뮤니케이션, 보고서 및 콘텐츠의 신뢰성을 높일 수 있습니다. 이는 고객, 클라이언트 및 이해관계자와의 신뢰를 구축하는 데 도움이 될 수 있습니다.

2. 향상된 의사 결정: 엔터프라이즈 애플리케이션, 특히 데이터 분석 및 의사 결정 지원과 관련된 애플리케이션에서 데이터 기반이 있는 LLM을 사용하면 보다 안정적인 통찰력을 제공할 수 있습니다. 이를 통해 더 나은 정보를 바탕으로 의사 결정을 내릴 수 있으며 이는 전략 계획 및 비즈니스 성장에 매우 중요합니다.

3. 규정 준수 : 많은 산업에서는 데이터 정확성 및 규정 준수에 대한 규제 요구 사항을 따릅니다. LLM을 통한 데이터 기반은 이러한 규정 준수 표준을 충족하는 데 도움이 되어 법적 또는 규제 문제의 위험을 줄일 수 있습니다.

4. 고품질 콘텐츠 생성: LLM은 마케팅, 고객 지원, 제품 설명 등 콘텐츠 제작에 자주 사용됩니다. 데이터 기반은 생성된 콘텐츠가 사실적으로 정확하도록 보장하여 허위 또는 오해의 소지가 있는 정보 또는 환각을 유포할 위험을 줄입니다.

5. 잘못된 정보 감소: 가짜 뉴스와 잘못된 정보의 시대에 데이터 접지는 기업이 생성하거나 공유하는 콘텐츠가 검증된 데이터 소스를 기반으로 하도록 보장함으로써 기업이 허위 정보의 확산을 막는 데 도움이 될 수 있습니다.

6. 고객 만족: 고객에게 정확하고 신뢰할 수 있는 정보를 제공하면 기업의 제품이나 서비스에 대한 고객의 만족도와 신뢰도를 높일 수 있습니다.

7. 위험 완화 : 데이터 기반은 부정확하거나 불완전한 정보를 기반으로 결정을 내려 재정적 또는 평판에 해를 끼칠 수 있는 위험을 줄이는 데 도움이 될 수 있습니다.

예: 고객 제품 추천 시나리오

openAI chatGPT를 사용하여 데이터 접지가 기업 사용 사례에 어떻게 도움이 될 수 있는지 살펴보겠습니다.

기본 프롬프트

Generate a short email adding coupons on recommended products to customer
기업 지식 그래프

ChatGPT에서 생성된 응답은 매우 일반적이고 맥락화되지 않았으며 원시적입니다. 이를 올바른 기업 고객 데이터로 수동으로 업데이트/매핑해야 하는데 비용이 많이 듭니다. 데이터 접지 기술을 사용하여 이것이 어떻게 자동화될 수 있는지 살펴보겠습니다.

기업이 이미 기업 고객 데이터와 고객을 위한 쿠폰 및 추천을 생성할 수 있는 지능형 추천 시스템을 보유하고 있다고 가정해 보겠습니다. chatGPT에서 생성된 이메일 텍스트가 우리가 원하는 것과 정확히 동일하고 수동 개입 없이 고객에게 이메일을 보내도록 자동화할 수 있도록 올바른 메타데이터로 메시지를 강화하여 위의 프롬프트를 매우 잘 기반화할 수 있습니다.

접지 엔진이 고객 데이터에서 올바른 강화 메타데이터를 얻고 아래 프롬프트를 업데이트한다고 가정해 보겠습니다. 기본 프롬프트에 대한 ChatGPT 응답이 어떻게 되는지 살펴보겠습니다.

접지 프롬프트

Generate a short email adding below coupons and products to customer Taylor and wish him a Happy holiday season from Team Aatagona, Atagona.com
Winter Jacket Mens - [https://atagona.com/men/winter/jackets/123.html] - 20% off
Rodeo Beanie Men’s - [https://atagona.com/men/winter/beanies/1234.html] - 15% off
접지 프롬프트 | 기업 지식 그래프

지상 프롬프트를 통해 생성된 응답은 기업이 고객에게 알리기를 원하는 방식과 정확히 같습니다. Gen AI의 이메일 응답에 포함된 풍부한 고객 데이터는 기업을 확장하고 유지하는 데 놀라운 자동화입니다.

소프트웨어 시스템을 위한 엔터프라이즈 LLM 접지 솔루션

엔터프라이즈 시스템에서 데이터를 기반으로 하는 방법에는 여러 가지가 있으며, 이러한 기술의 조합은 효과적인 데이터 기반 및 사용 사례에 맞는 신속한 생성에 사용될 수 있습니다. 검색 증강 발전(접지) 구현을 위한 잠재적 솔루션으로서의 두 가지 주요 경쟁자는 다음과 같습니다.

  1. 애플리케이션 데이터|지식 그래프
  2. 벡터 임베딩 및 의미론적 검색

이러한 솔루션의 사용법은 사용 사례와 적용하려는 접지에 따라 달라집니다. 예를 들어, 벡터 저장소가 제공하는 응답은 부정확하고 모호할 수 있는 반면, 지식 그래프는 정확하고 정확하며 사람이 읽을 수 있는 형식으로 저장됩니다.

위의 전략 위에 혼합할 수 있는 몇 가지 다른 전략은 다음과 같습니다.

  • 외부 API, 검색 엔진에 연결
  • 데이터 마스킹 및 규정 준수 시스템
  • 내부 데이터 저장소, 시스템과 통합
  • 실시간 여러 소스의 데이터 통합

이 블로그에서는 엔터프라이즈 애플리케이션 데이터 그래프를 사용하여 달성할 수 있는 방법에 대한 샘플 소프트웨어 디자인을 살펴보겠습니다.

기업 지식 그래프

지식 그래프는 다양한 개체와 개체 간의 관계에 대한 의미 정보를 나타낼 수 있습니다. 엔터프라이즈 세계에서는 고객, 제품 등에 대한 지식을 저장합니다. 기업 고객 그래프는 데이터를 효과적으로 기반으로 삼고 풍부한 프롬프트를 생성하는 강력한 도구입니다. 지식 그래프는 그래프 기반 검색이 가능해 사용자가 연결된 개념과 개체를 통해 정보를 탐색할 수 있어 보다 정확하고 다양한 검색 결과를 얻을 수 있습니다.

벡터 데이터베이스와의 비교

접지 솔루션 선택은 사용 사례에 따라 다릅니다. 그러나 다음과 같은 벡터에 비해 그래프에는 여러 가지 장점이 있습니다.

기준 그래프 접지 벡터 접지
분석적 쿼리 데이터 그래프는 구조화된 데이터 및 분석 쿼리에 적합하며 추상적인 그래프 레이아웃으로 인해 정확한 결과를 제공합니다. 벡터 데이터 저장소는 주로 구조화되지 않은 데이터, 벡터 임베딩을 사용한 의미론적 검색에서 작동하고 유사성 점수에 의존하기 때문에 분석 쿼리에서는 제대로 작동하지 않을 수 있습니다.
정확성과 신뢰성 지식 그래프는 노드와 관계를 사용하여 데이터를 저장하고 존재하는 정보만 반환합니다. 불완전하거나 관련성이 없는 결과를 방지합니다. 벡터 데이터베이스는 주로 유사성 점수 및 사전 정의된 결과 제한에 의존하기 때문에 불완전하거나 관련 없는 결과를 제공할 수 있습니다.
환각 교정하기 지식 그래프는 사람이 읽을 수 있는 데이터 표현으로 투명합니다. 이는 잘못된 정보를 식별 및 수정하고, 쿼리 경로를 추적하고, 수정하여 LLM(대형 언어 모델) 정확도를 높이는 데 도움이 됩니다. 벡터 데이터베이스는 판독 가능한 형식으로 저장되지 않은 블랙박스로 간주되는 경우가 많으며, 잘못된 정보를 쉽게 식별하고 수정하는 데 어려움을 겪을 수 있습니다.
보안 및 거버넌스 지식 그래프는 GDPR과 같은 규정을 포함하여 데이터 생성, 거버넌스 및 규정 준수에 대한 더 나은 제어 기능을 제공합니다. 벡터 데이터베이스는 불투명한 특성으로 인해 제한 및 거버넌스를 적용하는 데 어려움을 겪을 수 있습니다.

고급 디자인

지식 그래프와 공개 LLM을 기반으로 사용하는 기업을 시스템이 어떻게 찾을 수 있는지 매우 높은 수준에서 살펴보겠습니다.

기본 계층은 기업 고객 데이터와 메타데이터가 다양한 데이터베이스, 데이터 웨어하우스 및 데이터 레이크에 저장되는 곳입니다. 이 데이터로부터 데이터 지식 그래프를 구축하고 이를 그래프 DB에 저장하는 서비스가 있을 수 있습니다. 분산형 클라우드 기본 세계에는 이러한 데이터 저장소와 상호 작용하는 수많은 엔터프라이즈 서비스|마이크로 서비스가 있을 수 있습니다. 이러한 서비스 위에는 기본 인프라를 활용하는 다양한 애플리케이션이 있을 수 있습니다.

애플리케이션에는 내부 및 외부 AI 시스템과의 상호 작용이 필요한 시나리오 또는 지능형 자동화 고객 흐름에 AI를 포함시키는 다양한 사용 사례가 있을 수 있습니다. 생성적 AI 시나리오의 경우, 기업이 휴가 시즌 동안 개인화된 추천 제품에 대해 몇 가지 할인을 제공하는 이메일을 통해 고객을 타겟팅하려는 워크플로의 간단한 예를 들어보겠습니다. AI를 더욱 효과적으로 활용하는 최고 수준의 자동화를 통해 이를 달성할 수 있습니다.

높은 수준의 디자인

워크플로우

  • 이메일을 보내려는 워크플로는 고객 상황에 맞는 데이터가 포함된 기반 프롬프트를 보내 개방형 Gen-AI 시스템의 도움을 받을 수 있습니다.
  • 워크플로 애플리케이션은 GenAI 시스템을 활용하는 이메일 텍스트를 얻기 위해 백엔드 서비스에 요청을 보냅니다.
  • 백엔드 서비스는 접지 엔진으로 라우팅되는 프롬프트 생성기 서비스로 서비스를 라우팅합니다.
  • 접지 엔진은 해당 서비스 중 하나에서 모든 고객 메타데이터를 수집하고 고객 데이터 지식 그래프를 검색합니다.
  • 접지 엔진은 노드 전체에 걸쳐 그래프를 탐색하고 관련 관계는 필요한 최종 정보를 추출하여 프롬프트 생성기로 다시 보냅니다.
  • 프롬프트 생성기는 사용 사례에 대한 기존 템플릿과 함께 기반 데이터를 추가하고 기업이 통합하기로 선택한 개방형 AI 시스템(예: OpenAI/Cohere)에 기반 프롬프트를 보냅니다.
  • 개방형 GenAI 시스템은 이메일을 통해 고객에게 전송된 훨씬 더 관련성이 높고 상황에 맞는 응답을 기업에 반환합니다.

이를 두 부분으로 나누어 자세히 이해해 보겠습니다.

1. 고객 지식 그래프 생성

아래 디자인은 위의 예에 적합하며, 요구사항에 따라 다양한 방식으로 모델링이 가능합니다.

데이터 모델링: 그래프의 노드로 모델링된 다양한 테이블이 있고 노드 간의 관계로 테이블 간을 조인한다고 가정합니다. 위의 예에서는 다음이 필요합니다.

  • 고객의 데이터를 보유하는 테이블,
  • 제품 데이터를 보유하는 테이블,
  • 개인화된 추천을 위한 CustomerInterests(Clicks) 데이터를 보유하는 테이블
  • ProductDiscounts 데이터를 보유하는 테이블

이러한 모든 데이터를 여러 데이터 소스에서 수집하고 정기적으로 업데이트하여 고객에게 효과적으로 접근하는 것은 기업의 책임입니다.

이러한 테이블을 어떻게 모델링하고 고객 그래프로 변환할 수 있는지 살펴보겠습니다.

고객 그래프 | 기업 지식 그래프
기업 지식 그래프

2. 그래프 모델링

위의 그래프 시각화 도우미에서 고객 노드가 클릭 참여 데이터를 기반으로 다양한 제품과 더 나아가 할인 노드와 어떻게 관련되어 있는지 확인할 수 있습니다. 접지 서비스가 이러한 고객 그래프를 쿼리하고, 관계를 통해 이러한 노드를 탐색하고, 각 고객에게 적합한 할인에 대한 필수 정보를 얻는 것은 쉽습니다.

위의 샘플 그래프 노드 및 관계 JAVA POJO는 아래와 유사할 수 있습니다.

public class KnowledgeGraphNode implements Serializable { private final GraphNodeType graphNodeType; private final GraphNode nodeMetadata;
} public interface GraphNode {
} public class CustomerGraphNode implements GraphNode { private final String name; private final String customerId; private final String phone; private final String emailId;
}
public class ClicksGraphNode implements GraphNode { private final String customerId; private final int clicksCount;
} public class ProductGraphNode implements GraphNode { private final String productId; private final String name; private final String category; private final String description; private final int price;
} public class ProductDiscountNode implements GraphNode { private final String discountCouponId; private final int clicksCount; private final String category; private final int discountPercent; private final DateTime startDate; private final DateTime endDate;
}
public class KnowledgeGraphRelationship implements Serializable {  private final RelationshipCardinality Cardinality; } public enum RelationshipCardinality {  ONE_TO_ONE,  ONE_TO_MANY }

이 시나리오의 샘플 원시 그래프는 다음과 같습니다.

샘플 원시 그래프 | 기업 지식 그래프

고객 노드 'Taylor Williams'에서 그래프를 탐색하면 문제가 해결되고 올바른 제품 추천과 적합한 할인을 가져올 수 있습니다.

시중에는 엔터프라이즈 아키텍처에 적합한 수많은 그래프 저장소가 있습니다. Neo4j, TigerGraph, Amazon Neptune 및 OrientDB는 그래프 데이터베이스로 널리 채택됩니다.

테이블 형식 데이터(호수, 창고, 호수집의 구조화된 데이터)에 대한 그래프 쿼리를 가능하게 하는 그래프 데이터 레이크의 새로운 패러다임을 소개합니다. 이는 Zero-ETL을 활용하여 그래프 데이터 저장소에서 데이터를 수화하거나 유지할 필요 없이 아래 나열된 새로운 솔루션을 통해 달성됩니다.

  • PuppyGraph(그래프 데이터 레이크)
  • Timbr.ai

규정 준수 및 윤리적 고려 사항

데이터 보호: 기업은 GDPR 및 기타 PII 규정 준수에 따라 고객 데이터를 저장하고 사용할 책임이 있습니다. 저장된 데이터는 통찰력을 얻기 위해 처리 및 재사용하거나 AI를 적용하기 전에 관리되고 정리되어야 합니다.

환각과 화해: 기업은 또한 데이터의 잘못된 정보를 식별하고 쿼리 경로를 추적하고 수정하는 조정 서비스를 추가할 수 있으므로 LLM 정확도를 향상시키는 데 도움이 될 수 있습니다. 지식 그래프를 사용하면 저장된 데이터가 투명하고 사람이 읽을 수 있으므로 비교적 쉽게 달성할 수 있습니다.

제한적인 보존 정책: 개방형 LLM 시스템과 상호 작용하는 동안 데이터 보호를 준수하고 고객 데이터의 오용을 방지하려면 기업이 상호 작용하는 외부 시스템이 추가 분석 또는 비즈니스 목적을 위해 요청된 프롬프트 데이터를 보유하지 않도록 제로 보존 정책을 갖는 것이 매우 중요합니다.

결론

결론적으로 LLM(대형 언어 모델)은 인공 지능과 자연어 처리 분야에서 놀라운 발전을 보여줍니다. 자연어 이해 및 생성부터 복잡한 작업 지원에 이르기까지 다양한 산업과 애플리케이션을 변화시킬 수 있습니다. 그러나 LLM을 성공하고 책임감 있게 사용하려면 다양한 핵심 영역에 대한 강력한 기반과 기반이 필요합니다.

주요 요점

  • 기업은 다양한 시나리오에 LLM을 사용하는 동안 효과적인 접지 및 프롬프트를 통해 큰 이점을 얻을 수 있습니다.
  • 지식 그래프와 벡터 스토어는 널리 사용되는 접지 솔루션이며, 하나를 선택하는 것은 솔루션의 목적에 따라 달라집니다.
  • 지식 그래프는 벡터 저장소에 비해 더 정확하고 신뢰할 수 있는 정보를 가질 수 있으므로 추가 보안 및 규정 준수 계층을 추가하지 않고도 엔터프라이즈 사용 사례에 우위를 제공합니다.
  • 엔터티와 관계가 포함된 기존 데이터 모델링을 노드와 에지가 포함된 지식 그래프로 변환합니다.
  • 다양한 데이터 소스와 기업 지식 그래프를 기존 빅데이터 스토리지 기업과 통합합니다.
  • 지식 그래프는 분석 쿼리에 이상적입니다. 그래프 데이터 레이크를 사용하면 표 형식 데이터를 엔터프라이즈 데이터 스토리지의 그래프로 쿼리할 수 있습니다.

자주 묻는 질문

Q1. 대규모 언어 모델이란 무엇입니까?

A. LLM은 DL 기술과 대규모 데이터 세트를 사용하여 새로운 콘텐츠를 이해, 요약, 생성 및 예측하는 AI 알고리즘입니다.

Q2. 애플리케이션 데이터 그래프란 무엇입니까?

A. 응용 데이터 그래프는 데이터를 노드(Node)와 에지(Edge) 형태로 저장하는 데이터 구조입니다. 서로 다른 데이터 노드 간의 관계로 모델링합니다.

Q3. 벡터 데이터베이스란 무엇입니까?

A. 벡터 데이터베이스는 텍스트, 오디오, 비디오와 같은 비정형 데이터를 저장하고 관리합니다. 추천 엔진, 기계 학습, Gen-AI와 같은 애플리케이션에 대한 빠른 인덱싱 및 검색에 탁월합니다.

Q4. 벡터 스토어의 임베딩이란 무엇입니까?

A. 벡터 저장소에서 임베딩은 고차원 벡터 공간의 객체, 단어 또는 데이터 포인트를 숫자로 표현한 것입니다. 이러한 임베딩은 항목 간의 의미론적 관계와 유사성을 포착하여 효율적인 데이터 분석, 유사성 검색 및 기계 학습 작업을 가능하게 합니다.

Q5. 구조화된 데이터와 구조화되지 않은 데이터의 차이점은 무엇인가요?

A. 구조화된 데이터는 정의된 테이블과 스키마로 잘 구성되어 있습니다. 텍스트, 이미지, 오디오, 비디오와 같은 구조화되지 않은 데이터는 형식이 부족하기 때문에 분석하기가 더 어렵습니다.

이 기사에 표시된 미디어는 Analytics Vidhya의 소유가 아니며 작성자의 재량에 따라 사용됩니다. 

spot_img

최신 인텔리전스

spot_img