Logo Zephyrnet

Cadence Tensilica quay lần nâng cấp tiếp theo lên LX Architecture – Semiwiki

Ngày:

Khi xem xét kiến ​​trúc SoC, bạn rất dễ bị mắc kẹt trong những câu chuyện đơn giản. Chúng giả định rằng trung tâm điện toán xoay quanh lõi trung tâm hoặc cụm lõi, điển hình là Arm, gần đây có lẽ là tùy chọn RISC-V. Thêm một hoặc hai máy gia tốc và phần còn lại là chi tiết. Nhưng đối với các sản phẩm cạnh tranh ngày nay, quan điểm đó là một sự đơn giản hóa quá mức nguy hiểm. Hầu hết các sản phẩm phải điều chỉnh để phù hợp với hiệu suất ứng dụng, thời lượng pin và giá thành. Trong nhiều hệ thống, lõi CPU đa năng vẫn có thể quản lý quyền kiểm soát, tuy nhiên, công việc nặng nhọc đối với các ứng dụng phổ biến nhất đã chuyển sang các DSP chính thống đã được chứng minh hoặc các bộ tăng tốc AI cho mục đích đặc biệt. Trong các hệ thống tiêu thụ điện năng, nhạy cảm về giá, DSP cũng có thể xử lý việc điều khiển và AI trong một lõi.

Cadence Tensilica quay lần nâng cấp tiếp theo lên kiến ​​trúc LX

Khi chỉ có DSP mới có thể thực hiện công việc

Mặc dù các CPU mục đích chung hoặc CPU có phần mở rộng DSP có thể xử lý một số xử lý DSP nhưng chúng không được thiết kế để xử lý các luồng dữ liệu truyền tải thông lượng cao phổ biến trong nhiều giao thức truyền thông, ứng dụng âm thanh chất lượng cao, xử lý tín hiệu hình ảnh chất lượng cao, yêu cầu an toàn quan trọng. Xử lý radar và Lidar hoặc xử lý mạng lưới thần kinh phổ biến trong nhận dạng và phân loại đối tượng.

DSP vốn hỗ trợ số học dấu phẩy động và cố định cần thiết để xử lý các giá trị tương tự chi phối quá trình xử lý tín hiệu và chúng hỗ trợ các đường dẫn thực thi song song ồ ạt để tăng tốc tính toán phức tạp mà các giá trị này chảy qua (ví dụ như FFT và bộ lọc) đồng thời hỗ trợ thông lượng đáng kể để truyền dữ liệu. Tuy nhiên, các DSP này vẫn là bộ xử lý, được lập trình hoàn toàn bằng phần mềm, do đó vẫn giữ được tính linh hoạt và khả năng chống chịu trong tương lai mà các nhà phát triển ứng dụng mong đợi. Đó là lý do tại sao, sau nhiều năm bộ xử lý nhúng Arm có mặt khắp nơi và làn sóng tùy chọn RISC-V mới nổi, DSP vẫn là trung tâm của các thiết bị bạn sử dụng hàng ngày, bao gồm liên lạc, thông tin giải trí trên ô tô và ADAS cũng như tự động hóa gia đình. Chúng cũng hỗ trợ các chức năng hỗ trợ AI trong nhiều thiết bị nhỏ gọn nhạy cảm với nguồn điện – loa thông minh, điều khiển từ xa thông minh, thậm chí cả tai nghe nhét tai thông minh, máy trợ thính và tai nghe.

Dòng Tensilica LX và LX8

Dòng Tensilica Xtensa LX đã cung cấp nền tảng DSP ổn định trong nhiều năm. Một số số liệu thống kê mới đối với tôi là Tensilica đếm được hơn 60 tỷ thiết bị được vận chuyển xung quanh lõi của họ và họ đứng thứ 2 về doanh thu cấp phép bộ xử lý (sau Arm), củng cố mức độ thống trị của các giải pháp của họ trong lĩnh vực này.

Khách hàng phụ thuộc vào sự ổn định của nền tảng, vì vậy Tensilica phát triển kiến ​​trúc một cách chậm rãi; bản phát hành gần đây nhất, LX7, đã hoạt động trở lại vào năm 2016. Như bạn có thể mong đợi, Tensilica đảm bảo rằng các nền tảng vẫn tương thích với tất cả các hệ điều hành, công cụ gỡ lỗi và giải pháp ICE chính, được hỗ trợ bởi hệ sinh thái gồm các công cụ phát triển/phần mềm bên thứ ba. ISA đã được mở rộng ngay từ đầu, rất lâu trước khi RISC-V xuất hiện đồng thời mang lại những cơ hội khác biệt hóa tương tự như hiện đang phổ biến trong RISC-V. Nền tảng này chủ yếu hướng tới các ứng dụng nhúng, mang lại hiệu suất cao ở mức tiêu thụ điện năng thấp.

Phiên bản mới nhất trong dòng này, LX8, được phát hành gần đây và bổ sung hai tính năng chính vào kiến ​​trúc nhằm hỗ trợ phát triển trí thông minh ở biên, hệ thống con bộ nhớ L2 mới và DMA tích hợp. Tôi luôn thích xem xét các tính năng như thế này theo cách chúng kích hoạt các mục tiêu hệ thống lớn hơn, vì vậy đây là quan điểm của tôi.

Đầu tiên, bộ đệm L2 sẽ cải thiện hiệu suất đối với các lỗi L1, điều này sẽ dẫn đến tốc độ khung hình trên giây cao hơn cho các ứng dụng nhận dạng đối tượng, là một ví dụ. L2 cũng có thể được phân vùng thành các phần bộ đệm và bộ nhớ cố định, mang lại sự linh hoạt cho ứng dụng thông qua việc tối ưu hóa bộ nhớ L2 cho nhiều khối lượng công việc khác nhau. DMA tích hợp cùng với các tính năng khác hỗ trợ truyền 1D, 2D và 3D, rất quan trọng trong các chức năng AI. 1D có thể hỗ trợ luồng giọng nói, hình ảnh 2D và 3D sẽ rất cần thiết cho các khối dữ liệu radar/lidar. Hỗ trợ phần cứng này sẽ tăng tốc hơn nữa tốc độ khung hình. Ngoài ra, iDMA trong LX8 hỗ trợ giải nén giá trị 12, một nhu cầu quen thuộc trong việc truyền các trọng số mạng đã được huấn luyện trong đó các khoảng giá trị đáng kể có thể về 0 thông qua lượng tử hóa hoặc cắt tỉa và được nén thành một thứ như <XNUMX:XNUMX> thay vì một chuỗi XNUMX số XNUMX . Điều này tốt cho việc nén, nhưng cấu trúc mở rộng phải được phục hồi trước khi các phép toán tensor có thể được áp dụng trong suy luận. Một lần nữa, sự hỗ trợ của phần cứng sẽ đẩy nhanh tác vụ đó, giảm độ trễ giữa các lần cập nhật ma trận trọng số.

Đây không phải là những thay đổi mang tính cách mạng nhưng cần thiết đối với các nhà xây dựng sản phẩm, những người phải luôn dẫn đầu về hiệu suất trong khi vẫn duy trì mức tiêu thụ điện năng thấp. Cả SK Hynix và Synaptics đều đưa ra xác nhận. Bạn có thể đọc thông cáo báo chí nhấp vào ĐÂY .

Chia sẻ bài đăng này qua:

tại chỗ_img

Tin tức mới nhất

tại chỗ_img