Zephyrnet-logo

Cadence Tensilica draait volgende upgrade naar LX-architectuur – Semiwiki

Datum:

Bij het overwegen van SoC-architecturen kun je gemakkelijk verstrikt raken in eenvoudige verhalen. Deze gaan ervan uit dat het rekencentrum draait rond een centrale kern of kerncluster, meestal Arm, recentelijk misschien een RISC-V-optie. Gooi een gaspedaal of twee in en de rest is detail. Maar voor de huidige concurrerende producten is deze opvatting een gevaarlijke simplificatie. De meeste producten moeten afgestemd zijn op toepassingsafhankelijke prestaties, batterijduur en eenheidskosten. In veel systemen kunnen CPU-kernen voor algemeen gebruik nog steeds de controle beheren, maar het zware werk voor de populairste toepassingen is verplaatst naar beproefde reguliere DSP's of AI-versnellers voor speciale doeleinden. In kleine, prijsgevoelige, power-nipping-systemen kunnen DSP's ook de besturing en AI in één kern afhandelen.

Cadence Tensilica draait volgende upgrade naar LX-architectuur

Wanneer alleen een DSP het werk kan doen

Hoewel CPU's voor algemene doeleinden of CPU's met DSP-extensies enige DSP-verwerking aankunnen, zijn ze niet ontworpen om de streaminggegevensstromen met hoge doorvoer te verwerken die gebruikelijk zijn in een breed scala aan communicatieprotocollen, hoogwaardige audiotoepassingen, hoogwaardige beeldsignaalverwerking, veiligheidskritische Radar- en Lidar-verwerking of de neurale netwerkverwerking die gebruikelijk is bij objectherkenning en classificatie.

DSP's ondersteunen native vaste en drijvende-kommaberekeningen die essentieel zijn voor het verwerken van analoge waarden die de signaalverwerking domineren, en ze ondersteunen massaal parallelle uitvoeringspijplijnen om de complexe berekeningen waardoor deze waarden stromen te versnellen (denk bijvoorbeeld aan FFT's en filters) terwijl ze ook een aanzienlijke doorvoer ondersteunen voor het streamen van gegevens. Toch zijn deze DSP's nog steeds processors, volledig softwarematig programmeerbaar en behouden daardoor de flexibiliteit en toekomstbestendigheid die applicatie-ontwikkelaars verwachten. Dat is de reden waarom, na jaren van alomtegenwoordigheid van Arm-embedded processors en de opkomende golf van RISC-V-opties, DSP's nog steeds de kern vormen van apparaten die u dagelijks gebruikt, waaronder communicatie, auto-infotainment en ADAS, en domotica. Ze ondersteunen ook de AI-aangedreven functies van veel compacte, stroomgevoelige apparaten: slimme luidsprekers, slimme afstandsbedieningen, zelfs slimme oordopjes, gehoorapparaten en hoofdtelefoons.

De Tensilica LX-serie en LX8

De Tensilica Xtensa LX-serie biedt al jaren een stabiel DSP-platform. Een paar statistieken die nieuw voor mij waren, zijn dat Tensilica meer dan 60 miljard apparaten telt die rond hun kernen zijn verzonden en dat ze op de tweede plaats staan ​​wat betreft inkomsten uit processorlicenties (na Arm), wat onderstreept hoe dominant hun oplossingen op dit gebied zijn.

Klanten zijn afhankelijk van de stabiliteit van het platform, dus ontwikkelt Tensilica de architectuur langzaam; de laatste release, LX7, was in 2016. Zoals je zou verwachten, zorgt Tensilica ervoor dat platforms compatibel blijven met alle belangrijke besturingssystemen, debug-tools en ICE-oplossingen, ondersteund door een ecosysteem van software/dev-tools van derden. De ISA is vanaf het begin uitbreidbaar geweest, lang voordat RISC-V opkwam, en bood tegelijkertijd dezelfde mogelijkheden voor differentiatie die nu populair zijn in RISC-V. Het platform is sterk gericht op embedded applicaties en levert hoge prestaties bij een laag vermogen.

De nieuwste versie in deze serie, LX8, is onlangs uitgebracht en voegt twee belangrijke functies toe aan de architectuur ter ondersteuning van de groeiende intelligentie aan de edge: een nieuw L2-geheugensubsysteem en een geïntegreerde DMA. Ik vind het altijd leuk om naar dit soort functies te kijken in termen van hoe ze grotere systeemdoelstellingen mogelijk maken, dus hier is mijn mening.

Ten eerste zal de L2-cache de prestaties bij L1-missers verbeteren, wat zich zou moeten vertalen in hogere frames per seconde-snelheden voor objectherkenningstoepassingen, bijvoorbeeld. De L2 kan ook worden gepartitioneerd in cache- en vaste geheugensecties, wat applicatieflexibiliteit biedt door het L2-geheugen te optimaliseren voor een verscheidenheid aan werklasten. De geïntegreerde DMA ondersteunt onder andere 1D-, 2D- en 3D-overdrachten, erg belangrijk in AI-functies. 1D zou een spraakstream kunnen ondersteunen, 2D een beeld en 3D zou essentieel zijn voor radar/lidar-datakubussen. Deze hardwareondersteuning zal de framesnelheden verder versnellen. Ook ondersteunt de iDMA in LX8 decompressie van nulwaarden, een bekende behoefte bij het overbrengen van getrainde netwerkgewichten waarbij aanzienlijke delen van waarden op nul kunnen worden gezet door middel van kwantisering of snoeien en worden gecomprimeerd tot zoiets als <12:0> in plaats van een reeks van twaalf nullen . Dit is goed voor compressie, maar de uitgezette structuur moet worden hersteld voordat tensorbewerkingen in gevolgtrekking kunnen worden toegepast. Ook hier versnelt hardwareondersteuning die taak, waardoor de latentie tussen updates van de gewichtsmatrix wordt verminderd.

Geen revolutionaire veranderingen, maar essentieel voor productbouwers die toonaangevend moeten blijven op het gebied van prestaties en tegelijkertijd een laag energieverbruik moeten behouden. Zowel SK Hynix als Synaptics hebben steun verleend. U kunt het persbericht lezen HIER.

Deel dit bericht via:

spot_img

Laatste intelligentie

spot_img