제퍼넷 로고

검증 체인을 통해 신뢰할 수 있는 세대 잠금 해제: 프롬프트 엔지니어링의 도약 – KDnuggets

시간

검증 체인을 통해 신뢰할 수 있는 세대 잠금 해제: 프롬프트 엔지니어링의 도약
작성자가 Midjourney로 만든 이미지
 

  • CoVe(사고 사슬) 프롬프트 엔지니어링 방법은 LLM의 환각을 완화하고 그럴듯하지만 잘못된 사실 정보의 생성을 해결하도록 설계되었습니다.
  • CoVe는 XNUMX단계 프로세스를 통해 LLM이 응답 초안을 작성하고 검증하고 개선할 수 있도록 지원하여 정확성을 높이는 자체 검증 메커니즘인 구조화된 자체 검증을 육성합니다.
  • CoVe는 목록 기반 질문, 장문 텍스트 생성 등 다양한 작업에서 향상된 성능을 보여 환각을 줄이고 AI 생성 텍스트의 정확성을 강화하는 잠재력을 보여주었습니다.

우리는 실수를 바로잡기 위해 그들이 제공하는 응답을 숙고하는 언어 모델의 능력을 연구합니다.

인공 지능(AI) 영역에서 정확성과 신뢰성에 대한 끊임없는 추구는 신속한 엔지니어링의 획기적인 기술을 가져왔습니다. 이러한 기술은 생성 모델을 안내하여 수많은 쿼리에 정확하고 의미 있는 응답을 제공하는 데 중추적인 역할을 합니다. 최근의 출현 검증 체인 (CoVe) 방법은 이 탐구에서 중요한 이정표를 표시합니다. 이 혁신적인 기술은 LLM(대형 언어 모델)의 악명 높은 문제, 즉 구어적으로 환각이라고 알려진 그럴듯하지만 잘못된 사실 정보의 생성을 해결하는 것을 목표로 합니다. CoVe는 모델이 응답을 숙고하고 자체 검증 프로세스를 수행할 수 있도록 함으로써 생성된 텍스트의 신뢰성을 높이는 데 유망한 선례를 세웠습니다.

방대한 문서 모음을 기반으로 텍스트를 처리하고 생성하는 기능을 갖춘 급성장하는 LLM 생태계는 다양한 작업에서 놀라운 능력을 보여주었습니다. 그러나 특히 잘 알려지지 않거나 희귀한 주제에 대해 환각적인 정보를 생성하는 경향이라는 우려가 여전히 남아 있습니다. 검증 체인(Chain-of-Verification) 방법은 환각을 최소화하고 생성된 응답의 정확성을 향상시키는 구조화된 접근 방식을 제공하여 이러한 과제 속에서 희망의 등불로 등장합니다.

CoVe는 LLM의 환각을 완화하기 위해 XNUMX단계 메커니즘을 전개합니다.

  • 초기 대응 초안 작성
  • 초안의 사실 확인을 위한 검증 질문 계획
  • 편견을 피하기 위해 이러한 질문에 독립적으로 대답
  • 답변을 기반으로 최종 검증된 응답 생성

이 체계적인 접근 방식은 환각에 대한 우려를 해결할 뿐만 아니라 생성된 텍스트의 정확성을 높이는 자체 검증 프로세스도 포함합니다. 이 방법의 효율성은 목록 기반 질문, 비공개 도서 QA, 긴 형식의 텍스트 생성을 포함한 다양한 작업에서 입증되었으며 환각 감소 및 성능 향상을 보여줍니다.

CoVe를 채택하려면 LLM의 워크플로에 XNUMX단계 프로세스를 통합해야 합니다. 예를 들어, 역사적 사건 목록을 생성하는 임무를 맡을 때 CoVe를 사용하는 LLM은 처음에 응답 초안을 작성하고, 각 사건의 사실 확인을 위한 확인 질문을 계획하고, 해당 질문에 독립적으로 답변한 다음, 마지막으로 받은 검증을 기반으로 확인된 목록을 생성합니다. .

CoVe에 내재된 엄격한 검증 프로세스는 생성된 응답에서 더 높은 수준의 정확성과 신뢰성을 보장합니다. 검증에 대한 이러한 체계적인 접근 방식은 정보의 품질을 향상시킬 뿐만 아니라 AI 생성 프로세스 내에서 책임 문화를 조성하여 보다 신뢰할 수 있는 AI 생성 텍스트를 달성하는 데 중요한 진전을 가져옵니다.

 
예제 1

  • 문제: 20세기의 주목할 만한 발명품을 나열합니다.
  • 초기 초안: 인터넷, 양자역학, DNA 구조 발견
  • 확인 질문: 인터넷은 20세기에 발명되었나요? 양자역학은 20세기에 개발되었나요? DNA 구조는 20세기에 발견됐나요?
  • 최종 확인된 답변: 인터넷, 페니실린 발견, DNA 구조 발견

 
예제 2

  • 문제: 아프리카 국가 목록을 제공합니다.
  • 초기 초안: 나이지리아, 에티오피아, 이집트, 남아프리카공화국, 수단
  • 확인 질문: 나이지리아는 아프리카에 있나요? 에티오피아는 아프리카에 있나요? 이집트는 아프리카에 있나요? 남아프리카공화국은 아프리카에 속해 있나요? 수단은 아프리카에 있나요?
  • 최종 확인된 답변: 나이지리아, 에티오피아, 이집트, 남아프리카공화국, 수단

 
CoVe를 채택하려면 LLM의 워크플로에 XNUMX단계 프로세스를 통합해야 합니다. 예를 들어, 역사적 사건 목록을 생성하는 임무를 맡을 때 CoVe를 사용하는 LLM은 처음에 응답 초안을 작성하고, 각 사건의 사실 확인을 위한 확인 질문을 계획하고, 해당 질문에 독립적으로 답변한 다음, 마지막으로 받은 검증을 기반으로 확인된 목록을 생성합니다. .

 

검증 체인 프로세스
그림 1: 검증 체인 단순화 프로세스(작성자 이미지)
 

방법론에는 LLM을 제기하기 위한 질문과 함께 상황 내 예제가 필요하거나 원하는 경우 이러한 방식으로 각 질문에 접근하기 위해 CoVe 예제에서 LLM을 미세 조정할 수 있습니다.

검증 체인(Chain-of-Verification) 방법의 출현은 신뢰할 수 있고 정확한 AI 생성 텍스트를 달성하기 위한 신속한 엔지니어링의 발전을 입증하는 것입니다. CoVe는 환각 문제를 정면으로 해결함으로써 LLM에서 생성된 정보의 품질을 높이는 강력한 솔루션을 제공합니다. 자체 검증 메커니즘과 결합된 이 방법의 구조화된 접근 방식은 보다 신뢰할 수 있고 사실에 기반한 AI 생성 프로세스를 육성하기 위한 중요한 도약을 구현합니다.

CoVe의 구현은 실무자와 연구자 모두가 신속한 엔지니어링 기술을 계속 탐색하고 개선해야 한다는 분명한 요청입니다. 이러한 혁신적인 방법을 수용하는 것은 대규모 언어 모델의 잠재력을 최대한 활용하는 데 도움이 될 것이며, AI 생성 텍스트의 신뢰성이 단순한 열망이 아니라 현실이 되는 미래를 약속할 것입니다.

 
 

매튜 메이요 (@mattmayo13)는 컴퓨터 과학 석사 학위와 데이터 마이닝 분야 대학원 학위를 보유하고 있습니다. KDnuggets의 편집장인 Matthew는 복잡한 데이터 과학 개념을 쉽게 이해할 수 있도록 만드는 것을 목표로 합니다. 그의 전문적인 관심 분야에는 자연어 처리, 기계 학습 알고리즘, 신흥 AI 탐구가 포함됩니다. 그는 데이터 과학 커뮤니티에서 지식을 민주화하려는 사명을 갖고 있습니다. 매튜는 6살 때부터 코딩을 해왔습니다.

spot_img

VC 카페

VC 카페

최신 인텔리전스

spot_img