Logo Zephyrnet

Expedera đề xuất khả năng khuếch tán ổn định làm điểm chuẩn cho phần cứng biên dành cho AI – Semiwiki

Ngày:

Mới đây Bài viết của TechSpot gợi ý rằng Apple đang tiến hành thận trọng trong việc phát hành một số loại AI tổng hợp, có thể với iOS 18 và A17 Pro. Điều này thú vị không chỉ đối với những người dùng Apple như tôi mà còn đối với việc xác nhận rộng rãi hơn về cơ hội di động thực sự cho AI sáng tạo. Thành thật mà nói, điều đó dường như không phải là điều hiển nhiên, vì nhiều lý do. Việc tìm kiếm sự cân bằng giữa hiệu suất và nhu cầu bộ nhớ có vẻ khó khăn đối với các mô hình cơ sở có hàng tỷ tham số trở lên. Liệu việc tiêu hao điện có phải là một vấn đề? Sau đó, có những vấn đề về pháp lý và ảo giác, có lẽ có thể được quản lý thông qua các mô hình sử dụng được giới hạn cẩn thận. Bất chấp những thách thức rõ ràng, tôi thấy thật đáng khích lệ khi một công ty có xu hướng chu đáo hơn về việc phát hành sản phẩm hơn hầu hết mọi người đều nhìn thấy con đường dẫn đến thành công. Nếu họ có thể thì những người khác cũng có thể, điều này tạo nên blog gần đây từ Expedera đã khai sáng cho tôi.

Expedera đề xuất khả năng khuếch tán ổn định làm điểm chuẩn cho phần cứng biên dành cho AI

Tóm tắt nhanh về tạo hình ảnh tổng quát

AI hình ảnh sáng tạo là một lĩnh vực mà cơ hội chỉ mới bắt đầu được khám phá. Chúng ta đã quen với việc thay đổi hình nền cho các cuộc gọi Zoom/Google Meet, nhưng AI sáng tạo còn tiến xa hơn thế nhiều. Giờ đây, chúng ta có thể tái tạo hình ảnh của mình trong những bộ trang phục khác nhau với những đặc điểm khác nhau trong bối cảnh tưởng tượng – một thị trường khổng lồ dành cho những người tiêu dùng quan tâm đến hình ảnh. Thực tế hơn, chúng ta có thể thử quần áo ảo trước khi mua hoặc khám phá các lựa chọn khi tu sửa nhà bếp hoặc phòng tắm. Công nghệ này đã có sẵn trên đám mây (ví dụ: Bing Image Creator) nhưng có tất cả nhược điểm của các dịch vụ dựa trên đám mây, đặc biệt là về quyền riêng tư và chi phí. Hầu hết người tiêu dùng muốn tương tác với các dịch vụ đó thông qua thiết bị di động; một giải pháp tốt hơn sẽ là trí tuệ nhân tạo cục bộ được nhúng vào các nền tảng đó. AI sáng tạo thông qua mô hình Khuếch tán ổn định nguồn mở là một proxy tốt để các nền tảng phần cứng phục vụ nhu cầu này và nói chung hơn là cho các mô hình LLM dựa trên các công nghệ cốt lõi tương tự.

Bộ nhớ trên bo mạch và hiệu suất có thể được cân bằng ở biên không?

Đầu tiên, chúng ta cần hiểu đường ống Khuếch tán ổn định. Quá trình này bắt đầu bằng bộ mã hóa văn bản để xử lý lời nhắc (“Tôi muốn nhìn thấy một con tàu cướp biển nổi lộn ngược trên một biển thạch xanh”). Tiếp theo bước đó là mạng lưới thần kinh khử nhiễu xử lý phần khuếch tán của thuật toán, thông qua nhiều lần lặp lại, tạo ra thông tin cho hình ảnh cuối cùng từ các tham số đã được đào tạo. Tôi nghĩ đây là một kiểu đảo ngược với nhận dạng hình ảnh thông thường, khớp giữa yêu cầu lời nhắc và quá trình đào tạo để tạo ra sự khớp tổng hợp với lời nhắc. Cuối cùng, giai đoạn giải mã hiển thị hình ảnh từ dữ liệu được xây dựng ở bước trước. Mỗi giai đoạn này là một mô hình máy biến áp.

Tác giả blog Expedera, Pat Donnelly (Kiến trúc sư giải pháp), đưa ra bản phân tích chi tiết về các tham số, thao tác và di chuyển dữ liệu cần thiết trong suốt thuật toán mà tôi sẽ không cố gắng sao chép ở đây. Điều nổi bật đối với tôi là số lượng dữ liệu di chuyển khổng lồ. Tuy nhiên, anh chỉ giả định bộ nhớ làm việc 8 MB dựa trên các yêu cầu mà anh thấy với khách hàng thay vì thông lượng tối ưu. Khi tôi hỏi anh ấy về điều này, anh ấy nói rằng hoạt động rõ ràng sẽ phụ thuộc vào giao diện DDR để quản lý phần lớn hoạt động này.

Đây là sự chuyển đổi từ một trường phái tư tưởng mà tôi đã nghe - rằng việc thực thi mô hình phải giữ mọi thứ trong bộ nhớ cục bộ để đáp ứng các yêu cầu về hiệu suất. Nhưng điều đó sẽ đòi hỏi SRAM tích hợp lớn một cách vô lý. DRAM có ý nghĩa trong việc xử lý dung lượng, nhưng một trường phái tư tưởng khác cho rằng không ai muốn lắp nhiều DRAM như vậy vào thiết bị di động. Điều đó sẽ quá đắt. Cũng chậm và ngốn điện.

DRAM hoặc một số loại bộ nhớ ngoài chip khác có ý nghĩa hơn nhưng vấn đề chi phí thì sao? Xem tài liệu tham khảo ở trên trên Apple. Rõ ràng họ có thể đang xem xét bộ nhớ flash nên có lẽ cách tiếp cận này không quá hoang dã. Còn hiệu suất thì sao? Pat nói với tôi rằng đối với Stable Diffusion 1.5, giả sử công cụ MAC 8K với bộ nhớ trong 7 MB và chạy ở tốc độ 750 MHz với băng thông bộ nhớ ngoài 12 GBps, chúng có thể xử lý 9.24 hình ảnh/giây thông qua bộ khử nhiễu và 3.29 hình ảnh/giây thông qua bộ khử nhiễu. mạng giải mã. Đó là hiệu suất sẵn sàng cho người tiêu dùng rất đáng nể. Công suất luôn khó xác định vì nó phụ thuộc vào rất nhiều yếu tố, nhưng những con số tôi đã thấy cho thấy điều này cũng phù hợp với các kiểu máy sử dụng dự kiến ​​của người tiêu dùng.

Một cái nhìn sâu sắc rất hữu ích. Có vẻ như chúng ta nên đặt lại giả thuyết rằng AI biến áp lớn cho biên không thể phụ thuộc vào bộ nhớ ngoài chip. Một lần nữa bạn có thể đọc blog Expedera nhấp vào ĐÂY .

Chia sẻ bài đăng này qua:

tại chỗ_img

Tin tức mới nhất

tại chỗ_img