제퍼넷 로고

Amazon Bedrock 모델 사용자 정의를 사용하여 Amazon Titan Image Generator G1 모델 미세 조정 | 아마존 웹 서비스

시간

Amazon Titan 이미지 생성기 G1 다음을 통해 사용할 수 있는 최첨단 텍스트-이미지 모델입니다. 아마존 기반암, 다양한 맥락에서 여러 개체를 설명하는 프롬프트를 이해하고 생성된 이미지에서 이러한 관련 세부 정보를 캡처할 수 있습니다. 미국 동부(버지니아 북부) 및 미국 서부(오레곤) AWS 리전에서 사용할 수 있으며 스마트 자르기, 페인팅 내, 배경 변경과 같은 고급 이미지 편집 작업을 수행할 수 있습니다. 그러나 사용자는 모델이 아직 훈련되지 않은 사용자 정의 데이터 세트의 고유한 특성에 맞게 모델을 조정하고 싶어합니다. 사용자 정의 데이터 세트에는 브랜드 지침이나 이전 캠페인과 같은 특정 스타일과 일치하는 매우 독점적인 데이터가 포함될 수 있습니다. 이러한 사용 사례를 해결하고 완전히 개인화된 이미지를 생성하려면 다음을 사용하여 자체 데이터로 Amazon Titan 이미지 생성기를 미세 조정할 수 있습니다. Amazon Bedrock용 맞춤형 모델.

이미지 생성부터 편집까지, 텍스트-이미지 모델은 산업 전반에 걸쳐 폭넓게 적용됩니다. 직원의 창의성을 향상시키고 텍스트 설명만으로 새로운 가능성을 상상할 수 있는 능력을 제공할 수 있습니다. 예를 들어, 건축가의 설계 및 평면도 계획을 지원하고, 수동으로 작성하는 과정 없이 다양한 설계를 시각화할 수 있는 기능을 제공하여 더 빠른 혁신을 가능하게 합니다. 마찬가지로 그래픽과 일러스트레이션 생성을 간소화하여 제조, 소매 패션 디자인, 게임 디자인 등 다양한 산업 분야의 디자인에 도움을 줄 수 있습니다. 또한 텍스트-이미지 모델은 미디어 및 엔터테인먼트 사용 사례에서 개인화된 광고는 물론 대화형 몰입형 시각적 챗봇을 허용하여 고객 경험을 향상시킵니다.

이 게시물에서는 우리가 가장 좋아하는 애완동물인 개 Ron과 고양이 Smila라는 두 가지 새로운 카테고리를 학습하기 위해 Amazon Titan 이미지 생성기 모델을 미세 조정하는 과정을 안내합니다. 모델 미세 조정 작업을 위해 데이터를 준비하는 방법과 Amazon Bedrock에서 모델 사용자 지정 작업을 생성하는 방법에 대해 논의합니다. 마지막으로 다음을 사용하여 미세 조정된 모델을 테스트하고 배포하는 방법을 보여줍니다. 프로비저닝된 처리량.

개 론 고양이 스밀라

작업을 미세 조정하기 전에 모델 기능 평가

기초 모델은 대량의 데이터를 학습하므로 모델이 처음부터 충분히 잘 작동할 가능성이 있습니다. 그렇기 때문에 실제로 사용 사례에 맞게 모델을 미세 조정해야 하는지 또는 즉각적인 엔지니어링이 충분한지 확인하는 것이 좋습니다. 다음 스크린샷에 표시된 것처럼 기본 Amazon Titan 이미지 생성기 모델을 사용하여 개 Ron과 고양이 Smila의 이미지를 생성해 보겠습니다.

예상한 대로 기본 모델은 아직 Ron과 Smila를 알지 못하며 생성된 출력에는 다른 개와 고양이가 표시됩니다. 신속한 엔지니어링을 통해 우리가 가장 좋아하는 애완동물의 모습에 더 가까워질 수 있도록 더 많은 세부 정보를 제공할 수 있습니다.

생성된 이미지는 Ron 및 Smila와 더 유사하지만 모델이 이들의 전체 유사성을 재현할 수는 없다는 것을 알 수 있습니다. 이제 일관성 있고 개인화된 출력을 얻기 위해 Ron과 Smila의 사진으로 미세 조정 작업을 시작하겠습니다.

Amazon Titan 이미지 생성기 미세 조정

Amazon Bedrock은 Amazon Titan 이미지 생성기 모델을 미세 조정하기 위한 서버리스 환경을 제공합니다. 데이터를 준비하고 하이퍼파라미터를 선택하기만 하면 AWS가 대신 어려운 작업을 처리해 드립니다.

Amazon Titan 이미지 생성기 모델을 사용하여 세부 조정하면 AWS가 소유하고 관리하는 AWS 모델 개발 계정에 이 모델의 복사본이 생성되고 모델 사용자 지정 작업이 생성됩니다. 그런 다음 이 작업은 VPC의 미세 조정 데이터에 액세스하고 Amazon Titan 모델의 가중치가 업데이트됩니다. 그러면 새 모델이 다음 위치에 저장됩니다. 아마존 단순 스토리지 서비스 (Amazon S3) 사전 훈련된 모델과 동일한 모델 개발 계정에 있습니다. 이제 귀하의 계정에서만 추론에만 사용할 수 있으며 다른 AWS 계정과 공유되지 않습니다. 추론을 실행할 때 다음을 통해 이 모델에 액세스합니다. 프로비저닝된 용량 컴퓨팅 또는 직접 사용하여 Amazon Bedrock에 대한 일괄 추론. 선택한 추론 방식과 관계없이 데이터는 계정에 남아 있으며 AWS 소유 계정에 복사되거나 Amazon Titan 이미지 생성기 모델을 개선하는 데 사용되지 않습니다.

다음 다이어그램은이 워크 플로우를 보여줍니다.

데이터 개인정보 보호 및 네트워크 보안

프롬프트와 사용자 지정 모델을 포함하여 세부 조정에 사용된 데이터는 AWS 계정에 비공개로 유지됩니다. 모델 훈련이나 서비스 개선을 위해 공유되거나 사용되지 않으며, 제3자 모델 제공자와 공유되지 않습니다. 미세 조정에 사용되는 모든 데이터는 전송 중 및 저장 중 암호화됩니다. 데이터는 API 호출이 처리되는 동일한 리전에 유지됩니다. 당신은 또한 사용할 수 있습니다 AWS 프라이빗링크 데이터가 있는 AWS 계정과 VPC 사이에 프라이빗 연결을 생성합니다.

데이터 준비

모델 사용자 지정 작업을 생성하려면 먼저 다음을 수행해야 합니다. 훈련 데이터 세트 준비. 학습 데이터 세트의 형식은 생성 중인 사용자 정의 작업 유형(미세 조정 또는 지속적인 사전 학습)과 데이터 형식(텍스트-텍스트, 텍스트-이미지 또는 이미지-이미지)에 따라 달라집니다. 임베딩). Amazon Titan 이미지 생성기 모델의 경우 미세 조정에 사용할 이미지와 각 이미지에 대한 캡션을 제공해야 합니다. Amazon Bedrock에서는 이미지가 Amazon S3에 저장되고 이미지와 캡션 쌍이 여러 JSON 라인이 포함된 JSONL 형식으로 제공될 것으로 예상합니다.

각 JSON 줄은 image-ref, 이미지의 S3 URI, 이미지에 대한 텍스트 프롬프트가 포함된 캡션을 포함하는 샘플입니다. 이미지는 JPEG 또는 PNG 형식이어야 합니다. 다음 코드는 형식의 예를 보여줍니다.

{"image-ref": "s3://bucket/path/to/image001.png", "caption": ""} {"image-ref": "s3://bucket/path/to/image002.png", "caption": ""} {"image-ref": "s3://bucket/path/to/image003.png", "caption": ""}

"Ron" 및 "Smila"는 사람 이름과 같이 다른 상황에서도 사용할 수 있는 이름이므로 모델을 미세 조정하기 위한 프롬프트를 만들 때 식별자 "Ron the dog" 및 "Smila the cat"을 추가합니다. . 미세 조정 작업 흐름에 대한 요구 사항은 아니지만 이 추가 정보는 새 클래스에 맞게 사용자 정의할 때 모델에 대해 보다 상황에 맞는 명확성을 제공하고 '개 Ron'과 Ron이라는 사람 및 'Ron the dog'의 혼동을 방지합니다. 고양이 스밀라(Smila the cat)'는 우크라이나의 도시 스밀라(Smila)를 그린 작품이다. 이 논리를 사용하여 다음 이미지는 훈련 데이터 세트의 샘플을 보여줍니다.

하얀 개 침대에 누워 있는 개 론 타일 ​​바닥에 앉아 있는 개 론 카시트에 누워 있는 개 론
소파에 누워있는 고양이 스밀라 소파에 누워 카메라를 응시하는 고양이 스밀라 애완동물 캐리어에 누워 있는 고양이 스밀라

데이터를 사용자 정의 작업에서 예상하는 형식으로 변환하면 다음과 같은 샘플 구조가 표시됩니다.

{"이미지 참조": "/ron_01.jpg", "caption": "하얀 개 침대에 누워 있는 개 론"} {"image-ref": "/ron_02.jpg", "caption": "타일 바닥에 앉아 있는 개 론"} {"image-ref": "/ron_03.jpg", "caption": "카시트에 누워 있는 개 론"} {"image-ref": "/smila_01.jpg", "caption": "소파에 누워있는 고양이 스밀라"} {"image-ref": "/smila_02.jpg", "caption": "창문 옆 고양이 조각상 옆에 앉아 있는 고양이 스밀라"} {"image-ref": "/smila_03.jpg", "caption": "애완동물 캐리어에 누워 있는 고양이 스밀라"}

JSONL 파일을 생성한 후에는 이를 S3 버킷에 저장하여 사용자 지정 작업을 시작해야 합니다. Amazon Titan Image Generator G1 미세 조정 작업은 5~10,000개의 이미지로 작동합니다. 이 게시물에서 논의된 예에서는 60개의 이미지(개 Ron 30개, 고양이 Smila 30개)를 사용합니다. 일반적으로 배우려는 스타일이나 클래스를 더 다양하게 제공하면 미세 조정된 모델의 정확도가 향상됩니다. 그러나 미세 조정에 사용하는 이미지가 많을수록 미세 조정 작업을 완료하는 데 더 많은 시간이 필요합니다. 사용되는 이미지의 수도 미세 조정된 작업의 가격에 영향을 미칩니다. 인용하다 아마존 베드락 가격

Amazon Titan 이미지 생성기 미세 조정

이제 훈련 데이터가 준비되었으므로 새로운 사용자 정의 작업을 시작할 수 있습니다. 이 프로세스는 Amazon Bedrock 콘솔이나 API를 통해 수행할 수 있습니다. Amazon Bedrock 콘솔을 사용하려면 다음 단계를 완료하십시오.

  1. Amazon Bedrock 콘솔에서 다음을 선택합니다. 커스텀 모델 탐색 창에서
  2. 모델 맞춤설정 메뉴, 선택 미세 조정 작업 만들기.
  3. 럭셔리 미세 조정된 모델명에서 새 모델의 이름을 입력하세요.
  4. 럭셔리 작업 구성에서 훈련 작업의 이름을 입력합니다.
  5. 럭셔리 입력 데이터, 입력 데이터의 S3 경로를 입력합니다.
  6. . 하이퍼 파라미터 섹션에서 다음에 대한 값을 제공합니다.
    1. 단계 수 – 모델이 각 배치에 노출되는 횟수입니다.
    2. 배치 크기 – 모델 매개변수를 업데이트하기 전에 처리된 샘플 수.
    3. 학습률 – 각 배치 후에 모델 매개변수가 업데이트되는 속도입니다. 이러한 매개변수의 선택은 주어진 데이터 세트에 따라 다릅니다. 일반적인 지침으로, 다음 표에 자세히 설명된 대로 배치 크기를 8로 고정하고 학습률을 1e-5로 고정하고 사용된 이미지 수에 따라 단계 수를 설정하는 것이 좋습니다.
제공되는 이미지 수 8 32 64 1,000 10,000
권장 단계 수 1,000 4,000 8,000 10,000 12,000

미세 조정 작업 결과가 만족스럽지 않은 경우 생성된 이미지에서 스타일의 징후가 관찰되지 않으면 단계 수를 늘리고, 생성된 이미지에서 스타일이 관찰되었으나 스타일이 관찰되지 않으면 단계 수를 줄이는 것이 좋습니다. 인공물이나 흐릿함이 있습니다. 미세 조정된 모델이 40,000단계 후에도 데이터 세트의 고유한 스타일을 학습하지 못하는 경우 배치 크기 또는 학습 속도를 높이는 것이 좋습니다.

  1. . 출력 데이터 섹션에는 주기적으로 기록된 검증 손실 및 정확도 지표를 포함하여 검증 출력이 저장되는 S3 출력 경로를 입력합니다.
  2. . 서비스 액세스 섹션에서 새 생성 AWS 자격 증명 및 액세스 관리 (IAM) 역할을 선택하거나 S3 버킷에 액세스하는 데 필요한 권한이 있는 기존 IAM 역할을 선택하세요.

이 인증을 통해 Amazon Bedrock은 지정된 버킷에서 입력 및 검증 데이터 세트를 검색하고 검증 출력을 S3 버킷에 원활하게 저장할 수 있습니다.

  1. 왼쪽 메뉴에서 모델 미세 조정.

올바른 구성이 설정되면 Amazon Bedrock은 이제 사용자 지정 모델을 교육합니다.

프로비저닝된 처리량으로 미세 조정된 Amazon Titan 이미지 생성기 배포

사용자 지정 모델을 생성한 후 프로비저닝된 처리량을 사용하면 미리 결정된 고정 비율의 처리 용량을 사용자 지정 모델에 할당할 수 있습니다. 이 할당은 워크로드 처리를 위한 일관된 수준의 성능과 용량을 제공하므로 프로덕션 워크로드의 성능이 향상됩니다. 프로비저닝된 처리량의 두 번째 이점은 비용 제어입니다. 온디맨드 추론 모드를 사용한 표준 토큰 기반 가격은 대규모로 예측하기 어려울 수 있기 때문입니다.

모델의 미세 조정이 완료되면 이 모델이 맞춤형 모델' Amazon Bedrock 콘솔 페이지.

프로비저닝된 처리량을 구매하려면 방금 미세 조정한 사용자 지정 모델을 선택하고 프로비저닝된 처리량 구매.

그러면 프로비저닝된 처리량을 구매하려는 선택한 모델이 미리 채워집니다. 배포 전에 미세 조정된 모델을 테스트하려면 모델 단위를 값 1로 설정하고 약정 기간을 다음으로 설정하세요. 약정 없음. 이를 통해 신속하게 사용자 정의 프롬프트로 모델 테스트를 시작하고 훈련이 적절한지 확인할 수 있습니다. 또한, 새로운 미세 조정 모델과 새 버전을 사용할 수 있는 경우 동일한 모델의 다른 버전으로 업데이트하는 한 프로비저닝된 처리량을 업데이트할 수 있습니다.

미세 조정 결과

개 Ron과 고양이 Smila의 모델을 사용자 정의하는 작업에서 실험에 따르면 배치 크기가 5,000이고 학습률이 8e-1인 5단계의 하이퍼파라미터가 가장 좋은 것으로 나타났습니다.

다음은 맞춤형 모델로 생성된 이미지의 몇 가지 예입니다.

슈퍼히어로 망토를 두른 개 론 달 위의 개 론 선글라스를 끼고 수영장에 있는 개 론
눈위의 고양이 스밀라 흑백 옷을 입고 카메라를 응시하는 고양이 스밀라 크리스마스 모자를 쓴 고양이 스밀라

결론

이 게시물에서는 더 나은 품질의 이미지 생성을 위해 프롬프트를 엔지니어링하는 대신 미세 조정을 사용해야 하는 경우에 대해 논의했습니다. Amazon Titan 이미지 생성기 모델을 미세 조정하고 Amazon Bedrock에 사용자 지정 모델을 배포하는 방법을 보여주었습니다. 또한 보다 정확한 모델 사용자 정의를 위해 미세 조정을 위해 데이터를 준비하고 최적의 하이퍼파라미터를 설정하는 방법에 대한 일반적인 지침도 제공했습니다.

다음 단계로 다음을 조정할 수 있습니다. Amazon Titan Image Generator를 사용하여 고도로 개인화된 이미지를 생성하는 사용 사례를 소개합니다.


저자에 관하여

마이라 라데이라 탱케 AWS의 수석 생성 AI 데이터 과학자입니다. 기계 학습에 대한 배경 지식을 바탕으로 그녀는 업계 전반의 고객과 함께 AI 애플리케이션을 설계하고 구축한 10년 이상의 경험을 보유하고 있습니다. 기술 책임자로서 그녀는 고객이 Amazon Bedrock의 생성 AI 솔루션을 통해 비즈니스 가치 달성을 가속화하도록 돕습니다. 여가 시간에는 마이라(Maira)는 여행을 즐기고, 고양이 스밀라(Smila)와 놀고, 가족과 함께 따뜻한 곳에서 시간을 보냅니다.

다니 미첼 Amazon Web Services의 AI/ML 전문가 솔루션 아키텍트입니다. 그는 컴퓨터 비전 사용 사례에 중점을 두고 있으며 EMEA 전역의 고객이 ML 여정을 가속화할 수 있도록 지원합니다.

바라티 스리니바산 AWS Professional Services의 데이터 과학자이며 Amazon Bedrock에서 멋진 것을 구축하는 것을 좋아합니다. 그녀는 책임 있는 AI에 중점을 두고 기계 학습 애플리케이션에서 비즈니스 가치를 창출하는 데 열정을 갖고 있습니다. 고객을 위한 새로운 AI 경험을 구축하는 것 외에도 Bharathi는 공상 과학 소설을 쓰고 지구력 스포츠에 도전하는 것을 좋아합니다.

아친 자이나교 Amazon 인공 일반 지능(AGI) 팀의 응용 과학자입니다. 그는 텍스트-이미지 모델에 대한 전문 지식을 보유하고 있으며 Amazon Titan 이미지 생성기 구축에 중점을 두고 있습니다.

spot_img

최신 인텔리전스

spot_img