Zephyrnet Logosu

Expedera'dan Da Chuang ile 2024'e Bakış – Semiwiki

Tarih:

Da Chuang 2

Expedera, uç yapay zeka çıkarım uygulamalarında maliyeti ve karmaşıklığı azaltırken performansı, gücü ve gecikmeyi önemli ölçüde artıran özelleştirilebilir sinir motoru yarı iletken IP'si sağlar. Da, Expedera'nın kurucu ortağı ve CEO'sudur. Daha önce, optimize edilmiş bir bellek IP girişimi olan Memoir Systems'in kurucu ortağı ve COO'suydu ve Cisco tarafından başarılı bir şekilde satın alındı. Cisco'da Nexus 3/9K, MDS, CSPG ürünleri için Veri Merkezi Anahtarı ASIC'lerini yönetti. Da, Cisco, Nvidia ve Abrizio'da 25 yılı aşkın ASIC deneyimini getiriyor. UC Berkeley'den BS EECS, Stanford'dan MS/PhD EE derecesine sahiptir. Merkezi Santa Clara, Kaliforniya'da bulunan şirketin Birleşik Krallık, Çin, Japonya, Tayvan ve Singapur'da mühendislik geliştirme merkezleri ve müşteri destek ofisleri bulunmaktadır.

Bize biraz kendinizden ve şirketinizden bahsedin.

Adım Da Chuang ve Expedera'nın kurucu ortağı ve CEO'suyum. 2018 yılında kurulan Expedera, uç düğümlerden akıllı telefonlara ve otomotive kadar uç çıkarım uygulamaları için birinci sınıf özelleştirilebilir NPU IP sağlama konusunda itibarımızı artırdı. Origin NPU'muz artık 4'üncü sıradathnesil mimari, tek bir çekirdekte 128 TOPS'a kadar desteklerken, RNN, CNN, LSTM, DNN ve LLM'ler de dahil olmak üzere en geniş sinir ağları yelpazesi için sektör lideri işlem ve güç verimliliği sağlar.

-Şirketiniz için 2023'ün en heyecan verici zirvesi neydi?

>>2023, Expedera için muazzam bir büyüme yılıydı. Şirketimize Bath (İngiltere) ve Singapur olmak üzere iki yeni fiziksel lokasyon ekledik. Bu ofislerin her ikisi de gelecekteki Ar-Ge'ye, yeni nesil yapay zeka mimarilerinin geliştirilmesine ve önümüzdeki aylarda ve yıllarda duyacağınız diğer şeylere odaklanıyor. Bu bizim için çok heyecan verici olsa da, Expedera için 2023'teki belki de en önemli zirve noktası müşteri ve dağıtım büyümemizdi. Yıla, IP'mizin 10 milyondan fazla tüketici cihazında gönderildiği haberiyle başladık; bu, herhangi bir Semiconductor IP girişimi için dikkate değer bir rakamdır. Yıl boyunca, artık dünya çapındaki Tier 1 akıllı telefon OEM'lerini, tüketici cihazları yonga setlerini ve otomotiv yonga üreticilerini içeren müşteri tabanımızı genişletmeye devam ettik. NPU çözümümüz dünya çapında pazarın en iyisi olarak kabul ediliyor ve müşterilerimiz, ürünleri için en iyi yapay zeka motorunu istediklerinde bize geliyorlar.

-Şirketinizin 2023'te karşılaştığı en büyük zorluk neydi?

>>2023'teki en büyük zorluk ve en büyük fırsat, uç yapay zeka alanında Büyük Dil Modellerinin (LLM'ler) ve Kararlı Yayılımın (SD) ortaya çıkmasıydı. Yüksek Lisans/SD, yapay zekada bir paradigma değişimini temsil ediyor; çoğu müşterinin 2022 ve öncesinde kullandığı tipik CNN/RNN ağlarından daha fazla özelleştirilmiş işlem ve daha fazla işlem gücü gerektiriyor. Müşterilerimizin uyguladığı LLM/SD tabanlı uygulamaların çok sayıda olduğunu görmek inanılmazdı. Bununla birlikte, yüksek lisans ve SD'nin uçtaki ana zorluğu, bu ağların pille çalışan bir uç cihazın güç ve performans sınırları dahilinde çalışmasına izin vermek olmuştur.

-Şirketinizin bu en büyük zorluğun üstesinden gelme çalışmaları nasıl?

>> Müşterilerimiz yapay zekayla farklılaşan ürünleri öne çıkarmak istiyor; Harika bir kullanıcı deneyimiyle tüketiciye gerçek değer katan ürünler. Ancak pil ömrünün önemli ölçüde azalması kullanıcı deneyiminin bir parçası olarak kabul edilmez. LLM ve SD desteğini şu anda mevcut olan 4 ürünümüze entegre ettiğimizdeth Nesil mimaride tasarım vurgumuz, muhtemelen oluşturabileceğimiz en verimli bellek, en yüksek kullanım ve en düşük gecikme süreli NPU IP'yi sağlamaya odaklanmıştı. Bu yeni ağ türlerinin temel işleyişini inceledik; Hem donanım hem de yazılım mimarilerimizi gelecekteki ihtiyaçlara en iyi şekilde uyacak şekilde geliştirmenin doğru yolunu anlamak için veri hareketleri, yayılmalar, bağımlılıklar vb. Nasıl geliştiğimize bir örnek olarak, 4'ümüzth nesil mimari, geleneksel RNN ve CNN tarzı ağlarda pazar lideri işleme verimliliklerimizi korurken, LLM'ler ve SD için optimize edilmiş yeni matris çarpımı ve vektör bloklarını içerir.

-Sizce 2024 yılının en büyük büyüme alanı ne olacak ve neden?

>> En büyük büyüme alanlarımızdan biri, 2024'ün otomobillerde giderek artan çeşitlilikte yapay zeka uygulamalarını destekleyecek olmasıdır. Çoğu kişi yapay zekanın görsel tabanlı ağlar için otonom sürüş yığınında kullanımına aşina olsa da, ortaya çıkan çok daha fazla fırsat ve kullanım var. Elbette, diğer birçok pazar gibi otomobillerde de LLM kullanımının hızla arttığını görüyoruz. Bununla birlikte, yapay zekanın otomobilin diğer yönlerinde de (sürücü dikkati, arka koltuktaki yolcu tespiti, bilgi-eğlence, öngörücü bakım, kişiselleştirme ve daha birçok alanda) kullanımının arttığını görüyoruz. Bunların tümü, yapay zekanın uygulanmasının temel nedenlerinden biri olan tüketiciye mümkün olan en iyi kullanıcı deneyimini sağlamayı amaçlıyor. Ancak tüm bu kullanımların yapay zeka işleme ihtiyaçları, yalnızca gerçek performans yetenekleri açısından değil, aynı zamanda kullanım senaryosunun sunduğu sinir ağı türleri açısından da önemli ölçüde farklılık gösteriyor.

-Şirketinizin bu büyümeyi karşılama konusundaki çalışmaları nasıl?

>> Bahsi geçen LLM ve SD desteğinin yanı sıra Expedera'nın 4th nesil mimarisi de kolayca özelleştirilebilir. Expedera bir müşteriyle yeni bir tasarım yaptığında, tüm uygulama koşullarını (performans hedefleri, gerekli ağ desteği, alan ve güç sınırlamaları, gelecekteki ihtiyaçlar ve diğerleri) anlamaya çalışırız, böylece IP'mizi en iyi şekilde özelleştirebiliriz - esasen , müşteriye istemediği şeyler için fedakarlık yapmak zorunda kalmadan tam olarak istediğini verin. Müşteri, çeşitli ağlar için çok sayıda farklı kullanım ve destek sağlayan merkezi, yüksek performanslı bir motor isterse, bunu destekleyebiliriz. Müşteri yalnızca belirli görevleri ve ağları idare eden merkezi olmayan motorları devreye almak isterse bunu da veya aradaki herhangi bir yeri destekleyebiliriz. Ve bunların hepsi aynı IP mimarisinden olup, pazara çıkış süresi kesintisi olmadan gerçekleştirilir.

-2023 yılında hangi konferanslara katıldınız ve trafik nasıldı?

>>Expedera, Gömülü Vizyon Zirvesi ve Yapay Zeka Donanımı ve Yapay Zeka Zirvesi'nin yanı sıra CES gibi daha büyük etkinlikler dahil ancak bunlarla sınırlı olmamak üzere uç yapay zekaya odaklanan hedeflenen bir grup konferansta sergileniyor. Bu etkinliklerdeki trafik 2022 yılıyla aynı seviyede, yani makul görünüyordu. Yapay zeka günümüzün teknoloji dünyasında oldukça sıcak bir konu ve her şirket yapay zekayı ürünlerine, iş akışlarına ve tasarım süreçlerine entegre etmenin yollarını arıyor. Buna bağlı olarak, bu etkinliklere farklı ihtiyaç ve beklentilerle gelen katılımcı sayısının giderek arttığını gördük.

-2024 yılında konferanslara katılacak mısınız? Aynı mı yoksa daha fazla mı?

>>2024'te konferans planlarımızda, özellikle de teknoloji odaklı olanlarda, muhtemelen hafif bir genişleme görülecek. Yarı iletken ekosisteminin bir parçası olarak Expedera'nın boşlukta var olması mümkün değildir. Geçmiş etkinliklerde donanım ve yazılım yığınlarımızın yanı sıra akıllı telefonlar için güvenlik merkezli, her zaman algılayan NPU'muz gibi uygulamalarımız hakkında konuşmuştuk. Bu yıl, baharın sonlarında yapılacak konferanslar da dahil olmak üzere, zamanımızın büyük bir kısmını LLM'lerin ileri düzey uygulamalarını detaylandırarak geçireceğiz. Birçoğunuzla orada tanışmayı sabırsızlıkla bekliyoruz!

Ayrıca Oku:

Expedera, Yapay Zeka için Uç Donanımın Karşılaştırma Noktası Olarak Kararlı Yayılımı Öneriyor

WEBİNAR: Her Zaman Algılayan Dağıtımlar için İdeal Bir Sinir İşleme Motoru

Maliyete duyarlı uygulamalar için alan açısından optimize edilmiş yapay zeka çıkarımı

Bu gönderiyi şu yolla paylaş:

spot_img

En Son İstihbarat

spot_img