和風網標誌

Expedera 大創展望 2024 年 – Semiwiki

日期:

大創2號

Expedera 提供可自訂的神經引擎半導體 IP,可顯著提高效能、功耗和延遲,同時降低邊緣 AI 推理應用的成本和複雜性。 Da 是 Expedera 的共同創辦人兼執行長。在此之前,他曾擔任優化記憶體 IP 新創公司 Memoir Systems 的共同創辦人兼營運長,最終被思科成功收購。在思科,他領導了 Nexus 3/9K、MDS、CSPG 產品的資料中心交換器 ASIC。 Da 在 Cisco、Nvidia 和 Abrizio 擁有超過 25 年的 ASIC 經驗。他擁有加州大學柏克萊分校 EECS 學士學位、史丹佛大學 EE 碩士/博士學位。該公司總部位於加州聖克拉拉,在英國、中國、日本、台灣和新加坡設有工程開發中心和客戶支援辦事處。

告訴我們一些關於您自己和您的公司的資訊。

我叫大創,是 Expedera 的共同創辦人兼執行長。 Expedera 成立於 2018 年,在為從邊緣節點、智慧型手機到汽車的邊緣推理應用提供一流的可自訂 NPU IP 方面享有盛譽。我們的 Origin NPU,現已進入 4 期th新一代架構,在單核心中支援高達 128 TOPS,同時為最廣泛的神經網路(包括 RNN、CNN、LSTM、DNN 和 LLM)提供業界領先的處理和功效。

- 貴公司 2023 年最令人興奮的高峰是什麼?

>>2023 年對 Expedera 來說是個巨大成長的一年。我們為公司增加了兩個新的實體地點:巴斯(英國)和新加坡。這兩個辦公室都專注於未來的研發、開發下一代人工智慧架構,以及您將在未來幾個月和幾年內聽到的其他事情。雖然這對我們來說非常令人興奮,但 Expedera 在 2023 年最重要的高峰可能是我們的客戶和部署成長。新年伊始,我們就有消息稱,我們的 IP 已在超過 10 萬台消費設備中出貨,這對於任何半導體 IP 新創公司來說都是一個值得注意的數字。在這一年中,我們不斷擴大客戶群,目前包括全球一級智慧型手機 OEM、消費性設備晶片組和汽車晶片製造商。我們的 NPU 解決方案被全球公認為市場上最好的解決方案,當客戶想要為其產品提供絕對最佳的人工智慧引擎時,他們就會來找我們。

-2023年貴公司面臨的最大挑戰是什麼?

>> 2023 年最大的挑戰和最大的機會是邊緣人工智慧領域中大型語言模型 (LLM) 和穩定擴散 (SD) 的出現。 LLM/SD 代表了人工智慧的典範轉移——與大多數客戶在 2022 年及之前部署的典型 CNN/RNN 網路相比,它們需要更專業的處理和更多的處理能力。我們的客戶正在實施的基於 LLM/SD 的應用程式的數量之多令人難以置信。然而,邊緣的法學碩士和軟體定義的主要挑戰是允許這些網路在電池供電的邊緣設備的功率和性能範圍內運作。

-貴公司如何應對這項最大的挑戰?

>> 我們的客戶希望推出具有人工智慧差異化的產品;為消費者帶來真正價值和出色的用戶體驗的產品。然而,對電池壽命的重大影響並不被視為使用者體驗的一部分。當我們將 LLM 和 SD 支援整合到我們現在可用的 4th 在一代架構中,我們的設計重點是提供我們可能建構的最高效的記憶體效率、最高的利用率、最低的延遲 NPU IP。我們深入研究了這些新網路類型的底層工作原理;資料移動、傳播、依賴關係等…了解發展我們的硬體和軟體架構的正確方法,以最好地滿足未來的需求。作為我們如何發展的一個例子,我們的 4th 生成架構具有針對 LLM 和 SD 最佳化的新矩陣乘法和向量區塊,同時保持我們在傳統 RNN 和 CNN 式網路中市場領先的處​​理效率。

-您認為 2024 年最大的成長領域是什麼?為什麼?

>> 我們最大的成長領域之一是 2024 年將支援汽車中越來越多的人工智慧部署。雖然大多數人可能熟悉人工智慧在基於視覺的網路的自動駕駛堆疊中的使用,但還有更多的機會和用途正在出現。當然,與許多其他市場一樣,我們看到法學碩士在汽車領域的使用量激增。然而,我們也看到人工智慧在汽車其他方面的使用增加——駕駛注意力、後座乘客偵測、資訊娛樂、預測性維護、個人化等等。所有這些都旨在為消費者提供最佳的使用者體驗,這是實施人工智慧的關鍵原因之一。然而,所有這些用途的人工智慧處理需求差異很大,不僅在實際效能方面,而且在用例呈現的神經網路類型方面。

-貴公司如何因應這項成長?

>> 除了前面提到的 LLM 和 SD 支援之外,Expedera 的 4th 生成架構也很容易客製化。當 Expedera 與客戶進行新的設計時,我們尋求了解所有應用條件(性能目標、所需的網路支援、面積和功率限制、未來需求等),以便我們能夠最好地自訂我們的 IP – 本質上是,為客戶提供他們想要的東西,而不必為他們不需要的東西做出犧牲。如果客戶需要一個集中式、高效能的引擎來處理多種不同的用途並支援各​​種網絡,我們可以提供支援。如果客戶希望部署僅處理特定任務和網路的去中心化引擎,我們也可以提供支持,或介於兩者之間。而這一切都來自相同的 IP 架構,並且沒有上市時間的損失。

- 2023年您參加了哪些會議,流量如何?

>>Expedera 參加了一系列專注於邊緣人工智慧的目標會議,包括但不限於嵌入式視覺高峰會和人工智慧硬體與人工智慧高峰會,以及 CES 等大型活動。這些活動的客流量似乎與 2022 年持平,可以說是相當不錯的。人工智慧顯然是當今科技界的一個非常熱門的話題,每家公司都在尋找將人工智慧整合到他們的產品、工作流程和設計過程中的方法。因此,我們看到這些活動的參與者越來越多,他們有不同的需求和期望。

-您會參加 2024 年的會議嗎?相同還是更多?

>> 2024 年我們的會議計畫可能會略有擴大,尤其是那些專注於科技的會議計畫。作為半導體生態系的一部分,Expedera 不能獨立存在。我們在過去的活動中談到了我們的硬體和軟體堆棧,以及我們用於智慧型手機的以安全為中心的始終感知 NPU 等實現。今年,我們將花費大量時間詳細介紹法學碩士的邊緣實現,包括在今年春季晚些時候即將舉行的會議上。我們期待在那裡見到你們中的許多人!

相關閱讀:

Expedera 提議將穩定擴散作為人工智慧邊緣硬體的基準

網路研討會:用於始終感知部署的理想神經處理引擎

針對成本敏感型應用的區域優化 AI 推理

通過以下方式分享此帖子:

現貨圖片

最新情報

現貨圖片