제퍼넷 로고

Amazon Bedrock 및 Amazon Transcribe에서 생성 AI를 사용하여 녹음 요약 생성 | 아마존 웹 서비스

시간

회의록은 협업의 중요한 부분이지만 종종 문제가 발생하는 경우가 있습니다. 토론을 주도하고, 주의 깊게 듣고, 메모를 입력하는 사이에 주요 정보가 기록되지 않은 채 빠져나가기 쉽습니다. 메모를 캡처하더라도 체계적이지 않거나 읽기 어려워 쓸모가 없게 될 수 있습니다.

이번 포스팅에서는 사용법을 알아보겠습니다. 아마존 전사아마존 기반암 깨끗하고 간결한 비디오 또는 오디오 녹음 요약을 자동으로 생성합니다. 내부 팀 회의, 컨퍼런스 세션, 수입 결산 등 어떤 것이든 이 접근 방식을 사용하면 몇 시간의 콘텐츠를 핵심 포인트까지 추출하는 데 도움이 될 수 있습니다.

Amazon Bedrock을 사용하여 프로젝트 팀 회의를 기록하고 주요 내용을 요약하는 솔루션을 살펴봅니다. 또한 강좌 강의, 인터뷰, 영업 통화와 같은 다른 일반적인 시나리오에 맞게 이 솔루션을 사용자 정의할 수 있는 방법에 대해서도 논의합니다. 메모 작성 프로세스를 단순화하고 자동화하려면 계속 읽어보세요.

솔루션 개요

Amazon Transcribe와 Amazon Bedrock을 결합하면 시간을 절약하고 통찰력을 확보하며 협업을 강화할 수 있습니다. Amazon Transcribe는 음성을 텍스트로 변환하는 기능을 애플리케이션에 쉽게 추가할 수 있게 해주는 자동 음성 인식(ASR) 서비스입니다. 고급 딥 러닝 기술을 사용하여 오디오를 텍스트로 정확하게 변환합니다. Amazon Bedrock은 AI21 Labs, Anthropic, Cohere, Meta, Stability AI 및 Amazon과 같은 선도적인 AI 회사의 고성능 기초 모델(FM)을 단일 API로 선택할 수 있는 완전관리형 서비스입니다. 생성적 AI 애플리케이션을 구축하는 데 필요한 기능. Amazon Bedrock을 사용하면 다양한 상위 FM을 쉽게 실험하고 미세 조정 및 RAG(검색 증강 생성)와 같은 기술을 사용하여 데이터로 이를 개인적으로 사용자 지정할 수 있습니다.

이 게시물에 제시된 솔루션은 다음을 사용하여 조정됩니다. AWS 단계 함수 지정된 위치에 녹음을 업로드할 때 트리거되는 상태 머신 아마존 단순 스토리지 서비스 (Amazon S3) 버킷. Step Functions를 사용하면 서버리스 워크플로를 생성하여 AWS 서비스 전체에서 구성 요소를 조정하고 연결할 수 있습니다. 기본 복잡성을 처리하므로 애플리케이션 논리에 집중할 수 있습니다. 작업 조정, 분산 처리, ETL(추출, 변환 및 로드) 및 비즈니스 프로세스 자동화에 유용합니다.

다음 다이어그램은 높은 수준의 솔루션 아키텍처를 보여줍니다.

솔루션 워크플로에는 다음 단계가 포함됩니다.

  1. 사용자는 S3 자산 버킷에 녹음을 저장합니다.
  2. 이 작업은 Step Functions 기록 및 요약 상태 시스템을 트리거합니다.
  3. 상태 머신의 일부로서, AWS 람다 함수가 트리거되어 Amazon Transcribe를 사용하여 녹음을 기록하고 자산 버킷에 기록을 저장합니다.
  4. 두 번째 Lambda 함수는 기록을 검색하고 Amazon Bedrock의 Anthropic Claude 모델을 사용하여 요약을 생성합니다.
  5. 마지막으로 최종 Lambda 함수는 다음을 사용합니다. 아마존 단순 알림 서비스 (Amazon SNS) 녹음 요약을 수신자에게 보냅니다.

이 솔루션은 Amazon Bedrock의 Anthropic Claude가 있는 지역에서 지원됩니다. 가능.

상태 머신은 특정 작업을 수행하기 위한 단계를 조정합니다. 다음 다이어그램은 자세한 프로세스를 보여줍니다.

사전 조건

Amazon Bedrock 사용자는 모델을 사용하기 전에 모델에 대한 액세스를 요청해야 합니다. 이는 일회성 작업입니다. 이 솔루션의 경우 Amazon Bedrock에서 Anthropic Claude(Anthropic Claude Instant가 아님) 모델에 대한 액세스를 활성화해야 합니다. 자세한 내용은 다음을 참조하세요. 모델 액세스.

솔루션 리소스 배포

솔루션은 다음을 사용하여 배포됩니다. AWS 클라우드 포메이션 템플릿은 다음에서 찾을 수 있습니다. GitHub 레포, AWS 계정에 필요한 리소스를 자동으로 프로비저닝합니다. 템플릿에는 다음 매개변수가 필요합니다.

  • 요약을 보내는 데 사용되는 이메일 주소 – 요약은 이 주소로 전송됩니다. 추가 알림을 받기 전에 초기 Amazon SNS 확인 이메일을 확인해야 합니다.
  • 요약 지침 – 이는 요약을 생성하기 위해 Amazon Bedrock 모델에 제공되는 지침입니다.

솔루션 실행

AWS CloudFormation을 사용하여 솔루션을 배포한 후 다음 단계를 완료하십시오.

  1. CloudFormation 스택을 생성한 후 잠시 후에 수신해야 한다는 Amazon SNS 확인 이메일을 확인합니다.
  2. AWS CloudFormation 콘솔에서 방금 생성한 스택으로 이동합니다.
  3. 스택에서 출력 탭을 클릭하고 다음과 관련된 값을 찾으세요. AssetBucketName; 그것은 다음과 같이 보일 것입니다 summary-generator-assetbucket-xxxxxxxxxxxxx.
  4. Amazon S3 콘솔에서 자산 버킷으로 이동합니다.

여기에서 녹음 내용을 업로드할 수 있습니다. 유효한 파일 형식은 MP3, MP4, WAV, FLAC, AMR, OGG 및 WebM입니다.

  1. 녹음 파일을 recordings 폴더에 있습니다.

녹음을 업로드하면 Step Functions 상태 시스템이 자동으로 트리거됩니다. 이 예에서는 샘플 팀 회의 녹음을 사용합니다. sample-recording GitHub 저장소의 디렉터리입니다.

  1. Step Functions 콘솔에서 요약 생성기 상태 머신으로 이동합니다.
  2. 상태로 실행되는 상태 머신의 이름을 선택하세요. 달리는.

여기서는 기록을 처리하는 상태 머신의 진행 상황을 볼 수 있습니다.

  1. 도달한 후 Success 상태에 따라 녹음 요약을 이메일로 받게 됩니다.

또는 S3 자산 버킷으로 이동하여 기록 폴더에서 기록을 볼 수 있습니다.

요약 검토

CloudFormation 스택을 생성할 때 제공한 주소로 녹음 요약을 이메일로 받게 됩니다. 잠시 후에 이메일을 받지 못한 경우 스택을 생성한 후 수신했어야 하는 Amazon SNS 확인 이메일을 확인했는지 확인한 다음 기록을 다시 업로드하면 요약 프로세스가 트리거됩니다.

이 솔루션에는 솔루션을 테스트하는 데 사용할 수 있는 모의 팀 회의 녹음이 포함되어 있습니다. 요약은 다음 예와 유사합니다. 그러나 생성 AI의 특성으로 인해 출력은 약간 다르게 보이지만 내용은 비슷해야 합니다.

스탠드업의 주요 내용은 다음과 같습니다.

  • Joe는 작업 EDU1의 현재 상태 검토를 마치고 미래 상태를 개발하기 위한 새 작업을 만들었습니다. 해당 새 작업은 우선순위를 정하기 위해 백로그에 있습니다. 그는 이제 EDU2를 시작하고 있지만 리소스 선택이 차단되었습니다.
  • Rob은 모범 사례를 기반으로 SLG1에 대한 태그 지정 전략을 만들었지만 통일된 접근 방식을 따르기 위해 자체 전략을 만든 다른 팀과 협력해야 할 수도 있습니다. 태그 지정 전략을 조정하기 위해 새로운 작업이 생성되었습니다.
  • Rob은 SLG2에 대한 디버깅을 진행했지만 추가 도움이 필요할 수 있습니다. 이 작업은 추가 리소스를 확보할 시간을 확보하기 위해 스프린트 2로 이동됩니다.

다음 단계 :

  • Joe는 리소스 선택이 결정될 때까지 EDU2 작업을 계속합니다.
  • 팀 전체에 걸쳐 태그 지정 전략을 조정하기 위해 우선순위를 두어야 할 새로운 작업
  • SLG2가 Sprint 2로 이동했습니다.
  • 다음 주부터 스탠드업이 월요일로 이동합니다.

솔루션 확장

이제 작동하는 솔루션이 있으므로 특정 사용 사례에 맞게 솔루션을 사용자 정의할 수 있는 몇 가지 잠재적인 아이디어는 다음과 같습니다.

  • 사용 가능한 소스 콘텐츠와 원하는 출력에 맞게 프로세스를 변경해 보세요.
    • 기록을 사용할 수 있는 상황의 경우 대체 Step Functions 워크플로를 생성하여 기존 텍스트 기반 또는 PDF 기반 기록을 수집합니다.
    • Amazon SNS를 사용하여 이메일을 통해 수신자에게 알리는 대신 이를 사용하여 팀 협업 사이트와 같은 다른 엔드포인트나 팀의 채팅 채널로 출력을 보낼 수 있습니다.
  • Amazon Bedrock에 제공된 요약 지침 CloudFormation 스택 매개변수를 변경하여 사용 사례에 맞는 출력을 생성해 보십시오(생성 AI 프롬프트).
    • 회사의 실적 발표를 요약할 때 모델이 잠재적인 유망 기회, 관심 영역 및 계속 모니터링해야 하는 사항에 초점을 맞추도록 할 수 있습니다.
    • 이것을 사용하여 강좌 강의를 요약하는 경우 모델은 예정된 과제를 식별하고, 주요 개념을 요약하고, 사실을 나열하고, 녹음에서 잡담을 필터링할 수 있습니다.
  • 동일한 녹음에 대해 다양한 대상에 대해 서로 다른 요약을 만듭니다.
    • 엔지니어의 요약은 설계 결정, 기술 과제 및 향후 결과물에 중점을 둡니다.
    • 프로젝트 관리자의 요약은 일정, 비용, 결과물 및 작업 항목에 중점을 둡니다.
    • 프로젝트 후원자는 프로젝트 상태 및 에스컬레이션에 대한 간략한 업데이트를 받습니다.
    • 더 긴 녹화를 위해서는 다양한 관심도와 시간 투자에 대한 요약을 생성해 보세요. 예를 들어 단일 문장, 단일 단락, 단일 페이지 또는 심층 요약을 만듭니다. 프롬프트 외에도 max_tokens_to_sample 다양한 콘텐츠 길이를 수용하기 위한 매개변수입니다.

정리

솔루션을 정리하려면 이전에 생성한 CloudFormation 스택을 삭제하세요. 스택을 삭제해도 자산 버킷은 삭제되지 않습니다. 녹음이나 스크립트가 더 이상 필요하지 않은 경우 이 버킷을 별도로 삭제할 수 있습니다. Amazon Transcribe는 90일 후에 자동으로 트랜스크립션 작업을 삭제하지만 그 전에 수동으로 삭제할 수 있습니다.

결론

이 게시물에서는 Amazon Transcribe와 Amazon Bedrock을 사용하여 비디오 또는 오디오 녹음의 깔끔하고 간결한 요약을 자동으로 생성하는 방법을 살펴보았습니다. Amazon Bedrock, Amazon Transcribe 및 기타 AWS AI 서비스를 계속 평가해 보시기 바랍니다. 아마존 텍사스, 아마존 번역아마존 인식, 비즈니스 목표 달성에 어떻게 도움이 되는지 알아보세요.


저자에 관하여

롭 반스 AWS Professional Services의 수석 컨설턴트입니다. 그는 고객과 협력하여 자동화를 통해 복잡한 다중 계정 AWS 환경에서 대규모로 보안 및 규정 준수 요구 사항을 해결합니다.

제이슨 스텔 뉴잉글랜드 지역에 본사를 둔 AWS의 수석 솔루션 아키텍트입니다. 그는 고객과 협력하여 AWS 기능을 고객의 가장 큰 비즈니스 과제에 맞게 조정합니다. 업무 외에 그는 가족과 함께 물건을 만들고 만화 영화를 보는 데 시간을 보냅니다.

spot_img

최신 인텔리전스

spot_img