Logo Zephyrnet

Đó là một kết thúc cho Tháng Amazon SageMaker, 30 ngày nội dung, thảo luận và tin tức

Ngày:

Bạn có bỏ lỡ Tháng SageMaker không? Đừng nhìn xa hơn bài viết tổng hợp này để bắt kịp. Trong bài đăng này, chúng tôi chia sẻ những điểm nổi bật chính và tài liệu học tập để tăng tốc sự đổi mới của công nghệ máy học (ML) của bạn.

Vào ngày 20 tháng 2021 năm XNUMX, chúng tôi đã ra mắt Tháng Amazon SageMaker, 30 ngày hội thảo thực hành, nói chuyện công nghệ, phiên Twitch, bài đăng trên blog và sách phát. Mục tiêu của chúng tôi với SageMaker Month là kết nối bạn với các chuyên gia AWS, bắt đầu tài nguyên, hội thảo và học nội dung để thành công với ML. Sau đây là tóm tắt về những gì bạn có thể truy cập theo yêu cầu để bắt đầu hành trình ML của mình với Amazon SageMaker.

Giới thiệu các kế hoạch tiết kiệm của SageMaker

Để khởi động tháng SageMaker, chúng tôi đã giới thiệu Kế hoạch tiết kiệm của Amazon SageMaker, một mô hình định giá linh hoạt, dựa trên mức độ sử dụng cho SageMaker. Mục tiêu của Kế hoạch tiết kiệm SageMaker là cung cấp cho bạn sự linh hoạt để tiết kiệm tới 64% khi sử dụng phiên bản SageMaker ML để đổi lấy cam kết sử dụng nhất quán trong thời hạn 1 năm hoặc 3 năm. Ngoài ra, để giúp bạn tiết kiệm hơn nữa, chúng tôi đã công bố giảm giá trên các phiên bản CPU và GPU SageMaker.

Để cho phép khách hàng tiết kiệm nhiều hơn trên SageMaker, chúng tôi đã tổ chức Phiên Twitch thứ Sáu của SageMaker với Greg Coquillo, diễn giả có ảnh hưởng lớn thứ hai theo LinkedIn Top Voices 2020: Data Science & AI, cùng với Julien Simon và Segolene Dessertine-Panhard phác thảo các kỹ thuật tối ưu hóa chi phí bằng cách sử dụng Kế hoạch tiết kiệm của SageMaker và SageMaker.

Các Kế hoạch Tiết kiệm của SageMaker nâng cao năng suất và khả năng tối ưu hóa chi phí đã có sẵn trong Xưởng sản xuất Amazon SageMaker, có thể cải thiện năng suất của nhóm khoa học dữ liệu của bạn lên đến 10 lần. Studio cung cấp một giao diện trực quan duy nhất, nơi bạn có thể thực hiện tất cả các bước phát triển ML của mình. Studio cũng cung cấp cho bạn quyền truy cập, kiểm soát và khả năng hiển thị đầy đủ vào từng bước cần thiết để xây dựng, đào tạo và triển khai các mô hình. Để cho phép các nhóm của bạn hoạt động nhanh hơn và tăng năng suất, tìm hiểu cách tùy chỉnh sổ ghi chép Studio của bạn.

Bắt đầu với ML

SageMaker là dịch vụ ML toàn diện nhất, được xây dựng có mục đích cho mọi bước của vòng đời phát triển ML. SageMaker cung cấp tất cả các thành phần được sử dụng cho ML trong một dịch vụ duy nhất, vì vậy bạn có thể chuẩn bị dữ liệu và xây dựng, đào tạo và triển khai các mô hình.

Chuẩn bị dữ liệu là bước đầu tiên của việc xây dựng mô hình ML. Đó là một quá trình tốn thời gian và liên quan mà phần lớn là không khác biệt. Chúng tôi nghe từ khách hàng của mình rằng nó chiếm tới 80% thời gian của họ trong quá trình phát triển ML. Việc chuẩn bị dữ liệu luôn được coi là tẻ nhạt và tốn nhiều tài nguyên, do bản chất vốn có của dữ liệu là “bẩn” và không sẵn sàng cho ML ở dạng thô. Dữ liệu "bẩn" có thể bao gồm các giá trị, giá trị ngoại lệ bị thiếu hoặc sai, v.v. Kỹ thuật tính năng thường cần thiết để biến đổi các đầu vào để cung cấp các mô hình ML chính xác và hiệu quả hơn. Để trợ giúp về kỹ thuật tính năng, Cửa hàng tính năng Amazon SageMaker cung cấp một kho lưu trữ được xây dựng có mục đích để lưu trữ, cập nhật, truy xuất và chia sẻ các tính năng ML trong các nhóm phát triển.

Một thách thức khác với việc chuẩn bị dữ liệu là nó thường đòi hỏi nhiều bước. Mặc dù hầu hết các công cụ chuẩn bị dữ liệu độc lập cung cấp khả năng chuyển đổi dữ liệu, kỹ thuật tính năng và trực quan hóa, nhưng một số công cụ cung cấp xác nhận mô hình tích hợp. Và tất cả các bước chuẩn bị dữ liệu này được coi là tách biệt với ML. Điều cần thiết là một khuôn khổ cung cấp tất cả các khả năng này ở một nơi và được tích hợp chặt chẽ với phần còn lại của đường ống ML. Hầu hết các công cụ độc lập để chuẩn bị dữ liệu coi nó như một khối lượng công việc trích xuất, chuyển đổi và tải (ETL), khiến việc chuẩn bị dữ liệu lặp đi lặp lại, xác thực mô hình trên các bộ dữ liệu thử nghiệm, triển khai nó trong sản xuất và quay trở lại việc nhập các nguồn dữ liệu mới và thực hiện kỹ thuật tính năng bổ sung. Hầu hết việc chuẩn bị dữ liệu lặp đi lặp lại không được triển khai. Do đó, các mô-đun chuẩn bị dữ liệu cần được quản lý và tích hợp trước khi chúng được triển khai trong quá trình sản xuất. Những thực hành này trong ML đôi khi được gọi là MLOps.

Để giúp bạn vượt qua những thách thức này, bạn có thể sử dụng Trình sắp xếp dữ liệu Amazon SageMaker, khả năng đơn giản hóa quy trình chuẩn bị dữ liệu, kỹ thuật tính năng và từng bước của quy trình chuẩn bị dữ liệu, bao gồm lựa chọn, làm sạch và khám phá dữ liệu trên một giao diện trực quan duy nhất. Là một phần của Tháng SageMaker, chúng tôi đã tạo một hướng dẫn từng bước về cách bạn có thể chuẩn bị dữ liệu cho ML với Data Wrangler. Ngoài ra, bạn có thể học cách khách hàng tài chính sử dụng SageMaker mỗi ngày để dự đoán rủi ro tín dụng và phê duyệt các khoản vay. Ví dụ này sử dụng Data Wrangler và Làm rõ Amazon SageMaker để phát hiện sai lệch trong giai đoạn chuẩn bị dữ liệu.

Một phần khác của giai đoạn chuẩn bị dữ liệu là ghi nhãn dữ liệu. Gắn nhãn dữ liệu là nhiệm vụ xác định các đối tượng trong dữ liệu thô, chẳng hạn như văn bản, hình ảnh và video, đồng thời gắn thẻ chúng bằng các nhãn giúp mô hình ML của bạn đưa ra các dự đoán và ước tính chính xác. Ví dụ: trong một trường hợp sử dụng xe tự hành, các thiết bị Phát hiện và Định khoảng ánh sáng (LIDAR) thường được sử dụng để thu thập và tạo ra dữ liệu đám mây điểm ba chiều, tức là sự hiểu biết về không gian vật lý tại một thời điểm duy nhất. Đối với trường hợp sử dụng này, bạn cần gắn nhãn dữ liệu của mình được chụp cả trong không gian 2D và 3D để đưa ra dự đoán chính xác cao về phương tiện, làn đường và người đi bộ. Sự thật về mặt đất của Amazon SageMaker, một dịch vụ ghi nhãn dữ liệu được quản lý hoàn toàn, giúp dễ dàng xây dựng bộ dữ liệu đào tạo có độ chính xác cao cho ML trong không gian 2D và 3D bằng cách sử dụng quy trình ghi nhãn dữ liệu tùy chỉnh hoặc tích hợp sẵn. Để giúp bạn gắn nhãn dữ liệu của mình, chúng tôi đã tạo các bài đăng trên blog về cách thực hiện để giới thiệu cách chú thích dữ liệu đám mây điểm 3Dtự động hóa quy trình ghi nhãn dữ liệu cho một trường hợp sử dụng xe tự hành với Ground Truth.

Sau khi bạn xây dựng mô hình ML của mình, bạn phải đào tạo và điều chỉnh nó để đạt được độ chính xác cao nhất. Cải thiện hiệu suất của mô hình là một quá trình thử nghiệm và lặp đi lặp lại. Đối với Tháng SageMaker, chúng tôi đã tổng hợp một số kỹ thuật và phương pháp hay nhất về cách đào tạo và điều chỉnh các mô hình học sâu chất lượng cao với khả năng hiển thị đầy đủ bằng cách sử dụng SageMaker.

Khi bạn hài lòng với độ chính xác của mô hình, việc hiểu cách triển khai và quản lý mô hình trên quy mô lớn là chìa khóa. Đối với việc triển khai và quản lý mô hình, chúng tôi giới thiệu một ví dụ mà một nhà phát triển ứng dụng đang sử dụng Các điểm cuối đa mô hình của SageMaker để lưu trữ hàng nghìn mô hình và đường ống để tự động đào tạo lại để cải thiện các đề xuất trên các thành phố khác nhau của Hoa Kỳ.

Khi đã đến lúc triển khai mô hình của bạn và đưa ra dự đoán, một quy trình được gọi là suy luận, bạn có thể sử dụng SageMaker để suy luận trên đám mây hoặc trên các thiết bị cạnh. Amazon SageMaker Neo tự động biên dịch các mô hình ML cho bất kỳ khung ML nào và bất kỳ phần cứng mục tiêu nào. Một mô hình biên dịch Neo có thể tăng tốc độ suy luận YOLOv4 lên nhanh gấp đôi. Bạn cũng có thể giảm chi phí suy luận ML trên SageMaker với khả năng tăng tốc phần cứng và phần mềm.

Là một phần của Tháng SageMaker, chúng tôi cũng đưa ra một trường hợp sử dụng mẫu cho thấy cách bạn có thể sử dụng Trình quản lý Edge của Amazon SageMaker, khả năng tối ưu hóa, bảo mật, giám sát và duy trì các mô hình ML trên loạt máy ảnh thông minh, rô bốt, máy tính cá nhân và thiết bị di động. Blog này phác thảo cách quản lý và giám sát các mô hình trên các thiết bị cạnh như tuabin gió.

Cuối cùng, để tập hợp tất cả các khả năng SageMaker của chúng tôi và giúp bạn chuyển từ ý tưởng mô hình sang sản xuất, chúng tôi đã tạo giới thiệu về hội thảo SageMaker tương tự như các hội thảo thực hành ảo mà chúng tôi đã tiến hành trực tiếp và trong các Hội nghị AWS gần đây. Nó bao gồm mọi thứ bạn cần để bắt đầu với SageMaker theo tốc độ của riêng bạn.

ML thông qua các Đối tác của chúng tôi

Là một phần của Tháng SageMaker, chúng tôi đã hợp tác với Tableau và DOMO để trao quyền cho các nhà phân tích dữ liệu và kinh doanh với thông tin chi tiết do ML cung cấp mà không cần bất kỳ chuyên môn nào về ML. Với dữ liệu phù hợp sẵn có, bạn có thể sử dụng các công cụ ML và kinh doanh thông minh (BI) để giúp đưa ra các dự đoán cần thiết để tự động hóa và tăng tốc các quy trình và quy trình kinh doanh quan trọng.

Chúng tôi đã hợp tác với DOMO để bật ML cho mọi người với SageMaker. Domo AutoML, được cung cấp bởi Amazon SageMaker Tự động lái, cung cấp thông tin chi tiết về các vấn đề kinh doanh phức tạp và tự động hóa quy trình ra quyết định đầu cuối. Điều này giúp các tổ chức cải thiện khả năng ra quyết định và thích ứng nhanh hơn với những thay đổi của doanh nghiệp.

Chúng tôi cũng hợp tác với Tableau để tạo ra một blog đăng bàinói về công nghệ giới thiệu bản trình diễn từ đầu đến cuối và giải pháp Bắt đầu nhanh mới giúp các nhà phân tích dữ liệu dễ dàng sử dụng các mô hình ML được triển khai trên SageMaker trực tiếp trong bảng điều khiển Tableau của họ mà không cần viết bất kỳ mã tích hợp tùy chỉnh nào.

Cái gì tiếp theo

SageMaker Month tập trung vào tiết kiệm và tối ưu hóa chi phí, bắt đầu với ML và tìm hiểu nội dung để tăng tốc đổi mới ML. Khi kết thúc Tháng SageMaker, chúng tôi rất vui được chia sẻ Hội nghị thượng đỉnh về học máy AWS vào ngày 2 tháng 2021 năm 30. Hội nghị quy tụ các nhà khoa học hàng đầu trong ngành, khách hàng AWS và các chuyên gia để tìm hiểu sâu về nghệ thuật, khoa học và tác động của ML. Tham dự miễn phí, tìm hiểu về các tính năng trong hơn XNUMX phiên và tương tác với các nhà lãnh đạo trong phần Hỏi và Đáp trực tiếp.


Lưu ý

Shashank Murthy là Giám đốc Tiếp thị Sản phẩm Cấp cao với AWS Machine Learning. Mục tiêu của anh là giúp khách hàng dễ dàng xây dựng, đào tạo và triển khai các mô hình học máy bằng Amazon SageMaker. Để có được niềm vui bên ngoài công việc, Shashank thích đi bộ đường dài vùng Tây Bắc Thái Bình Dương, chơi bóng đá và chạy các cuộc đua vượt chướng ngại vật.

Coinsmart. Đặt cạnh Bitcoin-Börse ở Europa
Nguồn: https://aws.amazon.com/blogs/machine-learning/its-a-wrap-for-sagemaker-month-30-days-of-content-discussions-and-news/

tại chỗ_img

Tin tức mới nhất

tại chỗ_img