제퍼넷 로고

엔비디아 A100 텐서 코어 GPU 기반 아마존 EC2 인스턴스를 제공하는 AWS

시간

수만 명의 고객이 머신 러닝 (ML) 애플리케이션을 구축하기 위해 AWS를 사용합니다. Airbnb 및 Pinterest와 같은 고객은 AWS를 사용하여 검색 권장 사항을 최적화하고, Lyft 및 Toyota Research Institute는 자율 주행 차량 프로그램을 개발하고, Capital One 및 Intuit는 AI 기반 고객 지원자를 구축 및 배포합니다.

AWS는 초보자부터 전문 ML 전문가에 이르기까지 모든 유형의 고객에게 적합한 가장 광범위하고 깊이있는 ML 및 AI 서비스 포트폴리오를 제공합니다. 이 포트폴리오의 기본 구성 요소는 모든 규모의 ML 애플리케이션에 강력하고 비용 효율적인 인프라를 제공하는 AWS 컴퓨팅, 네트워킹 및 스토리지 서비스입니다.

NVIDIA GPU로 구동되는 딥 러닝을위한 고성능의 저비용의 확장 성 높은 컴퓨팅 인프라

모델 교육 시간은 모델의 정확성을 빠르게 반복하고 향상시키는 능력에 직접적인 영향을 미칩니다. AWS는 업계에서 NVIDIA® GPU 기반의 고성능의 비용 효율적인 Amazon EC2 인스턴스에 대한 액세스를 제공합니다.

AWS는 클라우드를 통해 처음으로 NVIDIA V100 Tensor Core GPU를 제공합니다. Amazon EC2 P3 인스턴스. AWS는 또한 클라우드를 통해 업계 최고 성능의 모델 훈련 GPU 플랫폼을 제공합니다. Amazon EC2 P3dn.24xlarge 인스턴스. 이 인스턴스에는 각각 100GB의 메모리를 가진 32 개의 NVIDIA V96 Tensor Core GPU, 100 개의 맞춤형 Intel® Xeon® Scalable (Skylake) vCPU, 업계 최초의 XNUMXGbps 인스턴스 별 네트워킹 대역폭 및 고성능의 저 지연 네트워크 패브릭 탄성 직물 어댑터 (EFA).

기본 인프라의 이러한 혁신은 다음과 같은 고성능 스토리지 서비스와 결합됩니다. Amazon Simple Storage Service(Amazon S3)Luster 용 Amazon FSxML 프레임 워크의 최적화 및 최적화를 통해 정확도를 높이고 새로운 기능을 도입하기 위해 모델을 반복하는 데 걸리는 시간을 크게 줄일 수 있습니다. 우리는 최근에 기록적인 성능을 보여주었습니다 총 256 개의 GPU가있는 3 개의 P24dn.2,048xlarge 인스턴스에서 BLP (NLP) 모델을 훈련시켜 이러한 NVIDIA GPU 인스턴스 중 하나. 대규모 GPU 인스턴스 클러스터에 교육 작업을 배포함으로써 교육 시간을 며칠에서 60 분 이상으로 단축했습니다.

모든 ML 모델이 같은 것은 아니며, 다른 모델은 다른 수준의 하드웨어 가속의 이점을 얻습니다. Amazon EC2 G4dn 인스턴스 최대 4 개의 NVIDIA TXNUMX 텐서 코어 GPU를 갖춘 ML 추론을위한 업계에서 가장 비용 효율적인 GPU 인스턴스는 덜 복잡한 ML 모델을 훈련하고 그래픽이 많은 응용 프로그램을위한 최적의 성능을 제공합니다.

Amazon EC100 인스턴스에 제공되는 NVIDIA A2 Tensor Core GPU

AI 모델의 복잡성이 계속 증가함에 따라 몇 년 전 ResNet-26의 모델 매개 변수 수가 50 만 개에서 현재 17 억 개로 늘어났습니다. 최신 모델을 사용하면 AWS 고객은 더 빠른 모델 교육을 지원할 수있는 고성능 인스턴스를 지속적으로 찾고 있습니다. 모델의 성능을 높이고 훈련 비용을 낮추기 위해 AWS는 새로운 NVIDIA A2 Tensor Core GPU를 기반으로 EC100 인스턴스를 제공 할 계획을 발표하게되어 기쁘게 생각합니다. 대규모 분산 교육의 경우 NVIDIA A2 GPU 기반 EC100 인스턴스가 EC2 P3dn.24xlarge 인스턴스의 기능을 기반으로하고 새로운 성능 벤치 마크를 설정할 수 있습니다. NVIDIA A2 GPU 기반의 EC100 인스턴스에 대한 자세한 내용과 조기 액세스에 참여할 수있는 내용은 다음을 참조하십시오. 여기에서 지금 확인해 보세요..


저자에 관하여

제프 무라 세 AWS EC2 가속 컴퓨팅 인스턴스의 선임 제품 마케팅 관리자로 GPU (Graphics Processing Unit) 또는 FPGA (Field Programmable Gate Array)와 같은 하드웨어 기반 컴퓨팅 가속기에 대한 액세스를 제공함으로써 고객이 컴퓨팅 요구를 충족 할 수 있도록 도와줍니다. 여가 시간에는 농구를하고 가족과 자전거 타기를 즐깁니다.

출처 : https://aws.amazon.com/blogs/machine-learning/aws-to-offer-nvidia-a100-tensor-core-gpu-based-amazon-ec2-instances/

spot_img

최신 인텔리전스

spot_img