Logo Zephyrnet

Bảo mật các lưỡi dao gia tốc cho khối lượng công việc AI / ML của trung tâm dữ liệu

Ngày:

Các trung tâm dữ liệu xử lý khối lượng công việc đào tạo và suy luận AI / ML khổng lồ cho các khách hàng cá nhân của họ. Một số lượng lớn khối lượng công việc như vậy đòi hỏi phải xử lý hiệu quả và để xử lý những khối lượng công việc này, chúng tôi đã thấy nhiều giải pháp mới xuất hiện trên thị trường. Một trong những giải pháp này là các lưỡi máy gia tốc có thể cắm được, thường được triển khai trong các mảng song song lớn, thực hiện các kiến ​​trúc xử lý thần kinh hiện đại nhất. Những lưỡi dao này xử lý các mô hình suy luận, thuật toán và dữ liệu đào tạo có giá trị và do đó chúng yêu cầu mức độ bảo vệ cao.

Nội dung máy học phải đối mặt với nhiều mối đe dọa khác nhau. Chúng có thể bao gồm các cuộc tấn công đầu vào nhằm mục đích cố gắng và tác động đến hệ thống AI để đưa ra các quyết định thay thế hoặc đánh cắp các tài sản có giá trị như mô hình suy luận, thuật toán và dữ liệu đào tạo. Các cuộc tấn công có thể nhắm mục tiêu vào phần mềm, chương trình cơ sở, phần cứng hoặc tất cả các nội dung này. Chúng có thể xâm lấn hoặc không xâm lấn. Họ có thể nhập qua mạng, thông qua một nút biên hoặc họ có thể nhắm mục tiêu trực tiếp đến các điểm cuối. Với ngày càng nhiều thiết bị được hỗ trợ bởi AI trong cuộc sống hàng ngày của chúng ta, bất kỳ cuộc tấn công nào vào chúng đều có thể đe dọa quyền riêng tư, tài sản và an toàn cá nhân.

Các cánh máy gia tốc có chứa một số thành phần chính. Trái tim của hệ thống được cung cấp bởi các chip tăng tốc mạnh mẽ, từ một số ít đến một loạt các đơn vị xử lý AI / ML chuyên dụng, mỗi bộ đều có bộ nhớ kèm theo riêng. Chúng xử lý nhiều tác vụ, trên nhiều dữ liệu nhất có thể, với độ trễ ngắn nhất. Thông thường, cũng có một CPU Gateway, với Flash và DDR chuyên dụng của riêng nó, quản lý các mô hình và nội dung, chương trình và điều khiển các bộ tăng tốc. Cuối cùng, có một kết nối với vải, được cung cấp bởi mạng tốc độ cao hoặc giao diện PCI Express (PCIe).

Lưỡi dao gia tốc cần tuân theo các yêu cầu bảo mật ở mức tối thiểu, xác thực và bảo vệ chính lưỡi dao. Tuy nhiên, có một số yêu cầu bảo mật bổ sung cần thiết để tăng tốc AI / ML. Như đã nói, việc bảo vệ tài sản tất nhiên là mối quan tâm hàng đầu. Điều này có thể bao gồm việc bảo vệ tài sản khỏi bị đánh cắp hoặc thay thế và đảm bảo rằng các quy định về quyền riêng tư của dữ liệu, chẳng hạn như HIPAA ở Hoa Kỳ và GDPR ở Châu Âu, được tuân thủ. Khi các lưỡi tăng tốc được cài đặt trong các máy chủ đám mây công cộng, chúng thường được chỉ định để xử lý nhiều người dùng hoặc người thuê. Trong trường hợp này, khả năng chuyển đổi giữa những người dùng hoặc người thuê khác nhau một cách an toàn là cực kỳ quan trọng. Cuối cùng, bảo mật cũng được yêu cầu để tránh lạm dụng hệ thống, để đảm bảo thanh toán hợp lý cho các dịch vụ được cung cấp và ngăn chặn việc sử dụng hệ thống một cách phi đạo đức.

Theo Sách trắng của Microsoft về chủ đề này, có bảy thuộc tính của các thiết bị bảo mật cao: gốc phần cứng đáng tin cậy, khả năng bảo vệ chuyên sâu, cơ sở máy tính nhỏ, đáng tin cậy, ngăn động, xác thực không cần mật khẩu, báo cáo lỗi và bảo mật tái tạo. Mỗi điều trong số này đều cần được kiểm tra chi tiết, nhưng với mục đích của blog này, chúng tôi sẽ thảo luận về một số trường hợp sử dụng bảo mật cho gốc phần cứng của niềm tin (RoT) trong bối cảnh bảo mật các lưỡi dao gia tốc.

Một trong những trường hợp sử dụng bảo mật chính là đảm bảo tính khả dụng của chính các bộ tăng tốc. Kẻ thù có thể giả mạo phần cứng của bộ tăng tốc để từ chối hoặc làm gián đoạn việc sử dụng hoặc bỏ qua các biện pháp bảo mật của nó. Nguồn gốc của sự tin cậy có thể giám sát trạng thái hệ thống và nội dung bộ nhớ, đồng thời phát hiện hoạt động giả mạo độc lập với các ứng dụng và CPU hoặc MBU. Gốc tin cậy cũng có thể phát hiện các cuộc tấn công bảo mật như tiêm lỗi.

Vì vậy, chính xác điều này sẽ hoạt động như thế nào? Gốc tin cậy và CPU Gateway giám sát kiểm tra và gỡ lỗi logic, cấu hình phần cứng, trạng thái phần cứng khác trong SoC. Nguồn gốc của sự tin tưởng vào trình tăng tốc giám sát hoạt động của trình tăng tốc AI. Gốc tin cậy định kỳ băm trạng thái SRAM nhúng đã biết để phát hiện giả mạo và nó cũng có thể băm dữ liệu flash bất biến định kỳ. Logic nội bộ bên trong gốc của sự tin cậy phát hiện các cuộc tấn công vật lý vào hệ thống và một công cụ giao thức bảo mật có thể giám sát lưu lượng mạng. Các ứng dụng bảo mật đang chạy bên trong ranh giới an toàn của gốc tin cậy sau đó xác định cách hành động khi phát hiện thấy bất thường.

Thứ hai, chúng tôi đã xác định trước đó rằng các mô hình suy luận và đào tạo là những tài sản có giá trị cần được bảo vệ. Trong khi sử dụng hoặc khi được tải vào bộ gia tốc AI, các mô hình này có thể bị chặn, thay thế hoặc thay đổi. Sau khi hoàn thành đào tạo, các mô hình suy luận kết quả cần được lưu trữ ở dạng mã hóa và được giải mã động khi sử dụng.

Cơ sở triển khai tin cậy cho kịch bản này sẽ bao gồm các bước sau. Mô hình suy luận mã hóa đã ký được lưu trữ trong một mô-đun flash ngoài chip. Mô-đun gốc của tin cậy đọc các mô hình suy luận từ flash, giải mã chúng và băm dữ liệu đã giải mã. Gốc tin cậy xác minh chữ ký và so sánh các hàm băm. Chỉ khi các băm khớp nhau, mô hình mới được tải vào bộ gia tốc. Ngoài ra, nếu mỗi bộ tăng tốc có đèn flash riêng, thì bộ phận tin cậy gốc cục bộ có thể xử lý việc này. Gốc tin cậy sẽ cung cấp khả năng mã hóa, băm và xác minh chữ ký số.

Cuối cùng, khi một hệ sinh thái AI hoàn chỉnh hoạt động ở chế độ suy luận, kẻ thù có thể nhắm mục tiêu hoặc can thiệp vào quá trình suy luận hoặc kết quả suy luận. Việc bảo vệ các kết quả suy luận có thể được thực hiện bằng cách sử dụng một kênh an toàn, giống như kênh được sử dụng để bảo vệ tính toàn vẹn của dữ liệu đầu vào. Trong trường hợp này, mô-đun máy chủ giao tiếp với các thiết bị biên qua mạng và sẽ có xác thực lẫn nhau bằng cách sử dụng các khóa và danh tính được cấp trước. Sau khi thiết lập một kênh giao tiếp an toàn, thiết bị gốc và thiết bị biên quản lý việc chuyển các kết quả suy luận đến các máy chủ. Sau khi được tải vào trình tăng tốc AI, sẽ có một kiểm tra tính toàn vẹn của các kết quả suy luận trước khi thực hiện chúng.

Rambus có ba thập kỷ chuyên môn về bảo mật và một danh mục lớn các giải pháp IP bảo mật phần cứng được thiết kế để hỗ trợ nhu cầu bảo mật của các trung tâm dữ liệu hiệu suất cao xử lý dữ liệu có giá trị. Chúng tôi có các giải pháp gốc của niềm tin phù hợp với nhu cầu của các máy gia tốc hiện đại để đào tạo AI / ML và các giải pháp nhẹ phù hợp với các động cơ suy luận trong các thiết bị IoT.

Nguồn bổ sung:

tại chỗ_img

Tin tức mới nhất

tại chỗ_img