ゼファーネットのロゴ

Cadence Tensilica が LX アーキテクチャへの次のアップグレードをスピン – Semiwiki

日付:

SoC アーキテクチャを検討するとき、単純な物語に囚われてしまいがちです。 これらは、コンピューティングの中心が中央のコアまたはコア クラスター (通常は Arm、最近ではおそらく RISC-V オプション) を中心に展開していることを前提としています。 アクセルを XNUMX つか XNUMX つ投入すれば、残りは細部です。 しかし、今日の競争力のある製品にとって、この見方は危険な過度の単純化です。 ほとんどの製品は、アプリケーションに依存するパフォーマンス、バッテリー寿命、および単価に合わせて調整する必要があります。 多くのシステムでは、依然として汎用 CPU コアが制御を管理している可能性がありますが、最もホットなアプリケーションの重労働は、実績のある主流の DSP または特殊用途の AI アクセラレータに移行しています。 小型で価格重視の電力消費システムでは、DSP は XNUMX つのコアで制御と AI を処理することもできます。

Cadence Tensilica が LX アーキテクチャへの次のアップグレードをスピン

DSP だけがその仕事を実行できる場合

汎用 CPU または DSP 拡張機能を備えた CPU は、一部の DSP 処理を処理できますが、幅広い通信プロトコル、高品質オーディオ アプリケーション、高品質画像信号処理、安全性が重要なシステムで一般的な高スループットのストリーミング データ フローを処理するように設計されていません。物体の認識と分類に一般的なレーダーおよびライダー処理、またはニューラル ネットワーク処理。

DSP は、信号処理を支配するアナログ値の処理に不可欠な固定小数点演算と浮動小数点演算をネイティブにサポートし、大規模な並列実行パイプラインをサポートして、これらの値が流れる複雑な計算 (FFT やフィルターなどを考えてください) を高速化すると同時に、大幅なスループットもサポートします。ストリーミングデータ用。 それでも、これらの DSP は依然としてプロセッサであり、完全にソフトウェアでプログラム可能であるため、アプリケーション開発者が期待する柔軟性と将来性を保持しています。 これが、Arm 組み込みプロセッサが何年も普及し、RISC-V オプションの台頭が始まった後も、DSP が通信、車載インフォテインメント、ADAS、ホーム オートメーションなど、毎日使用するデバイスの中心に位置している理由です。 また、スマート スピーカー、スマート リモコン、さらにはスマート イヤフォン、補聴器、ヘッドフォンなど、電力に敏感な多くの小型デバイス内の AI 搭載機能もサポートしています。

テンシリカ LX シリーズと LX8

Tensilica Xtensa LX シリーズは、長年にわたって安定した DSP プラットフォームを提供してきました。 私にとって新しい統計がいくつかありました。それは、Tensilica が自社のコアを中心に出荷されているデバイスの数が 60 億台を超え、プロセッサ ライセンス収入で (Arm に次ぐ) 第 2 位であるということであり、この分野で同社のソリューションがいかに支配的であるかを裏付けています。

顧客はプラットフォームの安定性に依存しているため、Tensilica はアーキテクチャをゆっくりと進化させます。 最後のリリースである LX7 は 2016 年にリリースされました。ご想像のとおり、Tensilica はプラットフォームがすべての主要な OS、デバッグ ツール、ICE ソリューションとの互換性を維持し、サードパーティ ソフトウェア/開発ツールのエコシステムによってサポートされることを保証します。 ISA は、RISC-V が登場するずっと前から拡張可能であり、現在 RISC-V で普及しているのと同じ差別化の機会を提供しています。 このプラットフォームは組み込みアプリケーションを主目的としており、低消費電力で高いパフォーマンスを実現します。

このシリーズの最新バージョンである LX8 は最近リリースされ、エッジでのインテリジェンスの増大をサポートする 2 つの主要な機能、新しい LXNUMX メモリ サブシステムと統合 DMA がアーキテクチャに追加されました。 私は常に、このような機能を、より大きなシステム目標をどのように実現できるかという観点から見るのが好きなので、ここでは私の見解を述べます。

まず、L2 キャッシュにより、L1 ミスのパフォーマンスが向上します。これにより、一例として、物体認識アプリケーションの 2 秒あたりのフレーム数が増加します。 L2 はキャッシュ セクションと固定メモリ セクションに分割することもでき、さまざまなワークロードに合わせて L1 メモリを最適化することでアプリケーションの柔軟性を提供します。 統合された DMA は、AI 機能において非常に重要な 2D、3D、および 1D 転送をサポートします。 2D は音声ストリーム、3D は画像をサポートでき、8D はレーダー/ライダー データ キューブに不可欠です。 このハードウェアのサポートにより、フレーム レートがさらに高速化されます。 また、LX12 の iDMA は、ゼロ値の圧縮解除をサポートします。これは、量子化または枝刈りによって値の大幅な範囲がゼロになり、0 個のゼロの文字列ではなく <XNUMX:XNUMX> のようなものに圧縮される、トレーニングされたネットワーク重みを転送する際の一般的なニーズです。 。 これは圧縮には適していますが、テンソル演算を推論に適用するには、展開された構造を復元する必要があります。 ここでも、ハードウェア アシストによってそのタスクが高速化され、重み行列の更新間の待ち時間が短縮されます。

革新的な変更ではありませんが、低消費電力を維持しながら最先端のパフォーマンスを維持する必要がある製品ビルダーにとっては不可欠です。 SK Hynix と Synaptics の両方が支持を表明しています。 プレスリリースを読むことができます こちら.

この投稿を共有する:

スポット画像

最新のインテリジェンス

スポット画像