Logo Zephyrnet

Tối ưu hóa hồ sơ thú cưng cho ứng dụng Petfinder của Purina bằng Nhãn tùy chỉnh Amazon Rekognition và AWS Step Functions | Dịch vụ web của Amazon

Ngày:

Purina US, một công ty con của Nestlé, có lịch sử lâu đời trong việc giúp mọi người dễ dàng nhận nuôi thú cưng hơn thông qua Petfinder, một thị trường kỹ thuật số gồm hơn 11,000 nơi trú ẩn động vật và các nhóm cứu hộ trên khắp Hoa Kỳ, Canada và Mexico. Là nền tảng nhận nuôi thú cưng hàng đầu, Petfinder đã giúp hàng triệu thú cưng tìm được ngôi nhà vĩnh viễn của chúng.

Purina liên tục tìm cách làm cho nền tảng Petfinder trở nên tốt hơn nữa cho cả nơi trú ẩn, nhóm cứu hộ cũng như người nhận nuôi thú cưng. Một thách thức mà họ phải đối mặt là phản ánh đầy đủ về giống động vật cụ thể được nhận nuôi. Bởi vì nhiều động vật trú ẩn là giống hỗn hợp nên việc xác định chính xác giống và thuộc tính trong hồ sơ vật nuôi đòi hỏi nỗ lực thủ công và tốn thời gian. Purina đã sử dụng trí tuệ nhân tạo (AI) và máy học (ML) để tự động hóa việc phát hiện giống động vật trên quy mô lớn.

Bài đăng này mô tả chi tiết cách Purina sử dụng Nhãn tùy chỉnh Rekognition của Amazon, Chức năng bước AWSvà các Dịch vụ AWS khác để tạo mô hình ML phát hiện giống thú cưng từ hình ảnh được tải lên, sau đó sử dụng dự đoán để tự động điền các thuộc tính thú cưng. Giải pháp tập trung vào các nguyên tắc cơ bản của việc phát triển quy trình ứng dụng AI/ML về chuẩn bị dữ liệu, đào tạo mô hình, đánh giá mô hình và giám sát mô hình.

Tổng quan về giải pháp

Dự đoán giống động vật từ một hình ảnh cần có mô hình ML tùy chỉnh. Phát triển một mô hình tùy chỉnh để phân tích hình ảnh là một công việc quan trọng đòi hỏi thời gian, chuyên môn và nguồn lực, thường mất hàng tháng để hoàn thành. Ngoài ra, nó thường yêu cầu hàng nghìn hoặc hàng chục nghìn hình ảnh được gắn nhãn thủ công để cung cấp cho mô hình đủ dữ liệu nhằm đưa ra quyết định chính xác. Việc thiết lập quy trình làm việc để kiểm tra hoặc xem xét các dự đoán mô hình nhằm xác thực việc tuân thủ các yêu cầu của bạn có thể làm tăng thêm độ phức tạp tổng thể.

Với Nhãn tùy chỉnh Rekognition, được xây dựng dựa trên khả năng hiện có của Nhận thức lại Amazon, bạn có thể xác định các đối tượng và cảnh trong hình ảnh cụ thể cho nhu cầu kinh doanh của mình. Nó đã được đào tạo về hàng chục triệu hình ảnh thuộc nhiều danh mục. Thay vì hàng nghìn hình ảnh, bạn có thể tải lên một tập hợp nhỏ các hình ảnh đào tạo (thường là vài trăm hình ảnh hoặc ít hơn cho mỗi danh mục) dành riêng cho trường hợp sử dụng của bạn.

Giải pháp sử dụng các dịch vụ sau:

  • Cổng API Amazon là một dịch vụ được quản lý hoàn toàn giúp các nhà phát triển dễ dàng xuất bản, duy trì, giám sát và bảo mật API ở mọi quy mô.
  • Sản phẩm Bộ công cụ phát triển đám mây AWS (AWS CDK) là một khung phát triển phần mềm nguồn mở để xác định cơ sở hạ tầng đám mây dưới dạng mã bằng các ngôn ngữ lập trình hiện đại và triển khai nó thông qua Hình thành đám mây AWS.
  • Xây dựng mã AWS là một dịch vụ tích hợp liên tục được quản lý hoàn toàn trên đám mây. CodeBuild biên dịch mã nguồn, chạy thử nghiệm và tạo các gói sẵn sàng triển khai.
  • Máy phát điện Amazon là một dịch vụ cơ sở dữ liệu phi quan hệ nhanh chóng và linh hoạt cho mọi quy mô.
  • AWS Lambda là dịch vụ điện toán theo hướng sự kiện cho phép bạn chạy mã cho hầu như mọi loại ứng dụng hoặc dịch vụ phụ trợ mà không cần cung cấp hay quản lý máy chủ.
  • Nhận thức lại Amazon cung cấp khả năng thị giác máy tính (CV) được đào tạo trước và có thể tùy chỉnh để trích xuất thông tin và hiểu biết sâu sắc từ hình ảnh và video của bạn. Với Nhãn tùy chỉnh Rekognition của Amazon, bạn có thể xác định các đối tượng và cảnh trong hình ảnh cụ thể cho nhu cầu kinh doanh của mình.
  • Chức năng bước AWS là một dịch vụ được quản lý hoàn toàn giúp điều phối các thành phần của ứng dụng phân tán và vi dịch vụ dễ dàng hơn bằng cách sử dụng quy trình làm việc trực quan.
  • Người quản lý hệ thống AWS là giải pháp quản lý toàn diện an toàn cho các tài nguyên trên AWS cũng như trong môi trường đa đám mây và kết hợp. Cửa hàng thông số, một khả năng của Trình quản lý Hệ thống, cung cấp khả năng lưu trữ phân cấp, an toàn để quản lý dữ liệu cấu hình và quản lý bí mật.

Giải pháp của Purina được triển khai như một giải pháp Cổng API HTTP điểm cuối, định tuyến các yêu cầu để có được thuộc tính thú cưng. Nó sử dụng Nhãn tùy chỉnh Rekognition để dự đoán giống vật nuôi. Mô hình ML được đào tạo từ hồ sơ thú cưng được lấy từ cơ sở dữ liệu của Purina, giả sử nhãn giống chính là nhãn thực. DynamoDB được dùng để lưu trữ các thuộc tính thú cưng. Lambda được dùng để xử lý yêu cầu thuộc tính thú cưng bằng cách phối hợp giữa API Gateway, Amazon Rekognition và DynamoDB.

Kiến trúc được triển khai như sau:

  1. Ứng dụng Petfinder định tuyến yêu cầu lấy thuộc tính thú cưng thông qua Cổng API.
  2. API Gateway gọi hàm Lambda để lấy thuộc tính thú cưng.
  3. Hàm Lambda gọi điểm cuối suy luận Nhãn tùy chỉnh Rekognition để dự đoán giống vật nuôi.
  4. Hàm Lambda sử dụng thông tin giống thú cưng được dự đoán để thực hiện tra cứu thuộc tính thú cưng trong bảng DynamoDB. Nó thu thập các thuộc tính của thú cưng và gửi lại cho ứng dụng Petfinder.

Sơ đồ sau minh họa quy trình giải pháp.

Nhóm Petfinder tại Purina muốn một giải pháp tự động mà họ có thể triển khai với mức bảo trì tối thiểu. Để thực hiện điều này, chúng tôi sử dụng Step Functions để tạo một máy trạng thái đào tạo các mô hình bằng dữ liệu mới nhất, kiểm tra hiệu suất của chúng trên một bộ điểm chuẩn và triển khai lại các mô hình nếu chúng đã được cải thiện. Việc đào tạo lại mô hình được kích hoạt từ số lần chỉnh sửa giống được thực hiện bởi người dùng gửi thông tin hồ sơ.

Đào tạo người mẫu

Phát triển một mô hình tùy chỉnh để phân tích hình ảnh là một công việc quan trọng đòi hỏi thời gian, chuyên môn và nguồn lực. Ngoài ra, nó thường yêu cầu hàng nghìn hoặc hàng chục nghìn hình ảnh được gắn nhãn thủ công để cung cấp cho mô hình đủ dữ liệu nhằm đưa ra quyết định chính xác. Việc tạo ra dữ liệu này có thể mất nhiều tháng để thu thập và đòi hỏi nỗ lực lớn để gắn nhãn dữ liệu đó để sử dụng trong học máy. Một kỹ thuật được gọi là học chuyển giúp tạo ra các mô hình chất lượng cao hơn bằng cách mượn các tham số của mô hình được đào tạo trước và cho phép các mô hình được đào tạo với ít hình ảnh hơn.

Thách thức của chúng tôi là dữ liệu của chúng tôi không được gắn nhãn hoàn hảo: con người nhập dữ liệu hồ sơ có thể và chắc chắn mắc lỗi. Tuy nhiên, chúng tôi nhận thấy rằng đối với các mẫu dữ liệu đủ lớn, các hình ảnh bị gắn nhãn sai chiếm một phần đủ nhỏ và hiệu suất của mô hình không bị ảnh hưởng quá 2% về độ chính xác.

Quy trình làm việc ML và máy trạng thái

Máy trạng thái Step Functions được phát triển để hỗ trợ việc tự động đào tạo lại mô hình Amazon Rekognition. Phản hồi được thu thập trong quá trình nhập hồ sơ—mỗi lần người dùng sửa đổi một giống được suy ra từ hình ảnh thành một giống khác, việc chỉnh sửa sẽ được ghi lại. Máy trạng thái này được kích hoạt từ một số ngưỡng chỉnh sửa có thể định cấu hình và các phần dữ liệu bổ sung.

Máy trạng thái chạy qua một số bước để tạo ra giải pháp:

  1. Tạo các tệp kê khai đào tạo và kiểm tra có chứa danh sách Dịch vụ lưu trữ đơn giản của Amazon Đường dẫn hình ảnh (Amazon S3) và nhãn của chúng để Amazon Rekognition sử dụng.
  2. Tạo tập dữ liệu Amazon Rekognition bằng cách sử dụng tệp kê khai.
  3. Huấn luyện phiên bản mô hình Amazon Rekognition sau khi tạo tập dữ liệu.
  4. Bắt đầu phiên bản mô hình khi quá trình đào tạo hoàn tất.
  5. Đánh giá mô hình và đưa ra các số liệu hiệu suất.
  6. Nếu số liệu hiệu suất đạt yêu cầu, hãy cập nhật phiên bản mô hình trong Cửa hàng tham số.
  7. Đợi phiên bản mô hình mới lan truyền trong các hàm Lambda (20 phút), sau đó dừng mô hình trước đó.

Đánh giá mô hình

Chúng tôi sử dụng nhóm giữ lại 20% ngẫu nhiên được lấy từ mẫu dữ liệu để xác thực mô hình của chúng tôi. Vì các giống mà chúng tôi phát hiện có thể định cấu hình nên chúng tôi không sử dụng tập dữ liệu cố định để xác thực trong quá trình đào tạo mà sử dụng bộ đánh giá được gắn nhãn thủ công để thử nghiệm tích hợp. Sự chồng chéo của tập hợp được gắn nhãn thủ công và các giống có thể phát hiện được của mô hình được sử dụng để tính toán số liệu. Nếu độ chính xác phát hiện giống của mô hình cao hơn ngưỡng đã chỉ định, chúng tôi sẽ quảng bá mô hình đó để sử dụng ở điểm cuối.

Sau đây là một số ảnh chụp màn hình về quy trình dự đoán thú cưng từ Nhãn tùy chỉnh Rekognition.

Triển khai với AWS CDK

Máy trạng thái Step Functions và cơ sở hạ tầng liên quan (bao gồm các hàm Lambda, dự án CodeBuild và các tham số của Trình quản lý hệ thống) được triển khai bằng AWS CDK bằng Python. Mã AWS CDK tổng hợp mẫu CloudFormation mà mã này sử dụng để triển khai tất cả cơ sở hạ tầng cho giải pháp.

Tích hợp với ứng dụng Petfinder

Ứng dụng Petfinder truy cập điểm cuối phân loại hình ảnh thông qua điểm cuối Cổng API bằng cách sử dụng yêu cầu POST chứa tải trọng JSON với các trường dành cho đường dẫn Amazon S3 tới hình ảnh và số lượng kết quả được trả về.

KPI bị ảnh hưởng

Để điều chỉnh chi phí tăng thêm khi chạy điểm cuối suy luận hình ảnh, chúng tôi đã chạy thử nghiệm để xác định giá trị mà điểm cuối thêm vào cho Petfinder. Việc sử dụng điểm cuối mang lại hai loại cải tiến chính:

  • Giảm nỗ lực cho các nơi trú ẩn cho thú cưng đang tạo hồ sơ thú cưng
  • Hồ sơ thú cưng hoàn chỉnh hơn, dự kiến ​​sẽ cải thiện mức độ liên quan của tìm kiếm

Các số liệu để đo lường nỗ lực và mức độ hoàn chỉnh của hồ sơ bao gồm số lượng trường điền tự động đã được sửa, tổng số trường đã điền và thời gian tải lên hồ sơ thú cưng. Những cải tiến về mức độ liên quan của tìm kiếm được suy ra một cách gián tiếp từ việc đo lường các chỉ số hiệu suất chính liên quan đến tỷ lệ chấp nhận. Theo Purina, sau khi giải pháp đi vào hoạt động, thời gian trung bình để tạo hồ sơ thú cưng trên ứng dụng Petfinder đã giảm từ 7 phút xuống còn 4 phút. Đó là một cải tiến lớn và tiết kiệm thời gian vì vào năm 2022, 4 triệu hồ sơ thú cưng đã được tải lên.

Bảo mật

Dữ liệu đi qua sơ đồ kiến ​​trúc được mã hóa trong quá trình truyền tải và ở trạng thái nghỉ, tuân theo Các biện pháp thực hành tốt nhất về Kiến trúc tối ưu của AWS. Trong tất cả các cam kết của AWS, chuyên gia bảo mật sẽ đánh giá giải pháp để đảm bảo cung cấp quá trình triển khai an toàn.

Kết luận

Với giải pháp dựa trên Nhãn tùy chỉnh Rekognition, nhóm Petfinder có thể đẩy nhanh việc tạo hồ sơ thú cưng cho nơi trú ẩn cho thú cưng, giảm gánh nặng hành chính cho nhân viên nơi trú ẩn. Quá trình triển khai dựa trên AWS CDK sẽ triển khai quy trình làm việc Step Functions để tự động hóa quy trình đào tạo và triển khai. Để bắt đầu sử dụng Nhãn tùy chỉnh Rekognition, hãy tham khảo Bắt đầu với Amazon Rekognition Custom Labels. Bạn cũng có thể kiểm tra một số Ví dụ về hàm bướcbắt đầu với AWS CDK.


Về các tác giả

Mason Cahill là Chuyên gia tư vấn DevOps cấp cao với Dịch vụ chuyên nghiệp của AWS. Anh ấy thích giúp đỡ các tổ chức đạt được mục tiêu kinh doanh của họ và đam mê xây dựng cũng như cung cấp các giải pháp tự động trên Đám mây AWS. Ngoài công việc, anh ấy thích dành thời gian cho gia đình, đi bộ đường dài và chơi bóng đá.

Matthew Chasse là nhà tư vấn Khoa học dữ liệu tại Amazon Web Services, nơi ông giúp khách hàng xây dựng các giải pháp machine learning có thể mở rộng. Matthew có bằng Tiến sĩ Toán học và thích leo núi và âm nhạc khi rảnh rỗi.

Jagtap Rushikesh là Kiến trúc sư giải pháp với hơn 5 năm kinh nghiệm về dịch vụ AWS Analytics. Anh ấy rất nhiệt tình giúp đỡ khách hàng xây dựng các giải pháp phân tích dữ liệu hiện đại và có thể mở rộng để hiểu rõ hơn về dữ liệu. Ngoài công việc, anh ấy thích xem Công thức 1, chơi cầu lông và đua xe Go Kart.

Tayo Olajide là một nhà tổng quát dày dạn kinh nghiệm về Kỹ thuật dữ liệu đám mây với hơn một thập kỷ kinh nghiệm trong việc kiến ​​trúc và triển khai các giải pháp dữ liệu trong môi trường đám mây. Với niềm đam mê chuyển đổi dữ liệu thô thành những hiểu biết có giá trị, Tayo đã đóng vai trò then chốt trong việc thiết kế và tối ưu hóa đường dẫn dữ liệu cho các ngành khác nhau, bao gồm ngành tài chính, y tế và ô tô. Với tư cách là người đi đầu về tư tưởng trong lĩnh vực này, Tayo tin rằng sức mạnh của dữ liệu nằm ở khả năng thúc đẩy việc ra quyết định sáng suốt và cam kết giúp các doanh nghiệp tận dụng tối đa tiềm năng dữ liệu của họ trong kỷ nguyên đám mây. Khi anh ấy không tạo ra các đường dẫn dữ liệu, bạn có thể thấy Tayo khám phá các xu hướng công nghệ mới nhất, đi bộ đường dài ngoài trời hoặc mày mò các thiết bị và phần mềm.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img