Logotip Zephyrnet

Obeti za leto 2024 z Da Chuangom iz Expedera – Semiwiki

Datum:

Da Chuang 2

Expedera zagotavlja prilagodljiv IP polprevodnikov nevronskega motorja, ki dramatično izboljša zmogljivost, moč in zakasnitev, hkrati pa zmanjša stroške in kompleksnost v robnih aplikacijah sklepanja z umetno inteligenco. Da je soustanovitelj in izvršni direktor podjetja Expedera. Pred tem je bil soustanovitelj in glavni izvršni direktor podjetja Memoir Systems, zagonskega podjetja IP za optimiziran pomnilnik, ki je vodilo do uspešnega prevzema s strani Cisca. Pri Ciscu je vodil ASIC stikala za podatkovne centre za izdelke Nexus 3/9K, MDS, CSPG. Da prinaša več kot 25 let izkušenj z ASIC pri Cisco, Nvidia in Abrizio. Ima BS EECS na UC Berkeley, MS/PhD EE na Stanfordu. Podjetje s sedežem v Santa Clari v Kaliforniji ima inženirske razvojne centre in pisarne za podporo strankam v Združenem kraljestvu, na Kitajskem, Japonskem, Tajvanu in Singapurju.

Povejte nam nekaj o sebi in svojem podjetju.

Moje ime je Da Chuang in sem soustanovitelj in izvršni direktor podjetja Expedera. Expedera, ustanovljena leta 2018, si je pridobila ugled zagotavljanja vrhunskega prilagodljivega NPU IP za aplikacije robnega sklepanja od robnih vozlišč in pametnih telefonov do avtomobilov. Naš Origin NPU, zdaj v svoji 4thgeneracija arhitekture, podpira do 128 TOPS v enem jedru, hkrati pa zagotavlja vodilno učinkovitost obdelave in energije za najširši nabor nevronskih mrež, vključno z RNN, CNN, LSTM, DNN in LLM.

-Kateri je bil najbolj razburljiv vrhunec leta 2023 za vaše podjetje?

>>Leto 2023 je bilo leto izjemne rasti za Expedero. Našemu podjetju smo dodali dve novi fizični lokaciji, Bath (UK) in Singapur. Oba urada sta osredotočena na prihodnje raziskave in razvoj, razvoj arhitektur umetne inteligence naslednje generacije ter druge stvari, o katerih boste slišali v prihodnjih mesecih in letih. Čeprav je to za nas zelo razburljivo, je bila morda najpomembnejša točka za Expedero v letu 2023 rast naših strank in uvajanja. Leto smo začeli z novico, da je bil naš IP dobavljen v več kot 10 milijonov potrošniških naprav, kar je opazna številka za vsako novo podjetje Semiconductor IP. Skozi vse leto smo še naprej širili svojo bazo strank, ki zdaj vključuje svetovne proizvajalce originalne opreme za pametne telefone Tier 1, nabore čipov za potrošniške naprave in proizvajalce avtomobilskih čipov. Naša rešitev NPU je globalno priznana kot najboljša na trgu, stranke pa pridejo k nam, ko želijo absolutno najboljši motor AI za svoje izdelke.

-Kateri je bil največji izziv, s katerim se je vaše podjetje soočilo v letu 2023?

>>Največji izziv leta 2023, skupaj z največjo priložnostjo, je bil pojav velikih jezikovnih modelov (LLM) in stabilne difuzije (SD) v prostoru robne umetne inteligence. LLM/SD predstavljajo spremembo paradigme v umetni inteligenci – zahtevajo bolj specializirano obdelavo in več procesorske moči kot tipična omrežja CNN/RNN, ki jih je večina strank uvajala leta 2022 in prej. Neverjetno je videti ogromno število aplikacij, ki temeljijo na LLM/SD, ki jih izvajajo naše stranke. Vendar pa je bil glavni izziv LLM-jev in SD na robu omogočanje tem omrežjem, da delujejo znotraj ovojnice moči in zmogljivosti robne naprave, ki se napaja z baterijo.

- Kako se delo vašega podjetja spopada s tem največjim izzivom?

>> Naše stranke želijo predstaviti izdelke, ki se razlikujejo po AI; izdelki, ki potrošniku prinašajo pravo vrednost s fantastično uporabniško izkušnjo. Vendar pomembni udarci glede življenjske dobe baterije niso sprejeti kot del uporabniške izkušnje. Ker smo podporo za LLM in SD integrirali v naš zdaj na voljo 4th generacije arhitekture je bil naš poudarek pri načrtovanju osredotočen na zagotavljanje najučinkovitejšega pomnilnika, največje izkoriščenosti in najnižje zakasnitve NPU IP, ki bi ga lahko zgradili. Vrtali smo v osnovno delovanje teh novih vrst omrežij; premike podatkov, širjenje, odvisnosti itd., da razumemo pravi način za razvoj naših arhitektur strojne in programske opreme, da se najbolje ujemata s prihodnjimi potrebami. Kot primer, kako smo se razvijali, je naš 4th generacija arhitekture vključuje novo matrično množenje in vektorske bloke, optimizirane za LLM in SD, hkrati pa ohranja našo vodilno učinkovitost obdelave na trgu v tradicionalnih omrežjih RNN in CNN.

-Katero bo po vašem mnenju največje področje rasti v letu 2024 in zakaj?

>> Eno od naših največjih področij rasti je leto 2024, ki bo podpiralo vedno več različnih uvedb umetne inteligence v avtomobilih. Čeprav je večina verjetno seznanjena z uporabo umetne inteligence v skladu za avtonomno vožnjo za vizualno temelječa omrežja, se pojavlja veliko več priložnosti in uporab. Vsekakor vidimo, da uporaba LLM v avtomobilih skokovito narašča, tako kot na mnogih drugih trgih. Vendar pa opažamo tudi povečano uporabo umetne inteligence pri drugih vidikih avtomobila – pozornost voznika, zaznavanje potnikov na zadnjih sedežih, infotainment, prediktivno vzdrževanje, personalizacija in mnogi drugi. Vse to je namenjeno zagotavljanju najboljše možne uporabniške izkušnje potrošniku, kar je eden ključnih razlogov za uvedbo AI. Vendar se potrebe po obdelavi umetne inteligence pri vseh teh uporabah dramatično razlikujejo, ne samo glede dejanskih zmogljivosti delovanja, ampak tudi glede na vrste nevronskih mrež, ki jih predstavlja primer uporabe.

- Kako se vaše podjetje ukvarja s to rastjo?

>> Skupaj z zgoraj omenjeno podporo LLM in SD, Expedera's 4th arhitektura generacije je tudi zlahka prilagodljiva. Ko se Expedera loti novega oblikovanja s stranko, skušamo razumeti vse pogoje aplikacije (cilje zmogljivosti, zahtevano omrežno podporo, omejitve območja in moči, prihodnje potrebe in drugo), da lahko najbolje prilagodimo svoj IP – v bistvu , dajo stranki natanko tisto, kar si želi, ne da bi se morali žrtvovati za stvari, ki jih ne želijo. Če stranka želi centraliziran, visoko zmogljiv mehanizem, ki omogoča številne različne uporabe in podporo za različna omrežja, lahko to podpremo. Če stranka želi uvesti decentralizirane motorje, ki obravnavajo samo določene naloge in omrežja, lahko podpremo tudi to – ali kjerkoli vmes. In vse to je iz iste arhitekture IP, izvedeno brez časovnih kazni za trženje.

-Katerih konferenc ste se udeležili v letu 2023 in kakšen je bil promet?

>>Expedera razstavlja na ciljni skupini konferenc, osredotočenih na robno umetno inteligenco, vključno z vrhom Embedded Vision Summit in AI Hardware & AI Summit, vendar ne omejeno nanje, ter večjimi dogodki, kot je CES. Promet na teh dogodkih se je zdel enak kot v letu 2022, se pravi spoštovanja vreden. Umetna inteligenca je danes očitno zelo vroča tema v tehnološkem svetu in vsako podjetje išče načine za integracijo umetne inteligence v svoje izdelke, poteke dela in proces oblikovanja. V skladu s tem smo na teh dogodkih opazili vedno večjo raznolikost udeležencev, vsi pa prihajajo z različnimi potrebami in pričakovanji.

-Ali se boste leta 2024 udeležili konferenc? Enako ali več?

>>V letu 2024 bomo verjetno rahlo razširili naše konferenčne načrte, zlasti tiste, ki so osredotočeni na tehnologijo. Kot del polprevodniškega ekosistema si Expedera ne more privoščiti obstoja v vakuumu. Na preteklih dogodkih smo govorili o naših nizih strojne in programske opreme, pa tudi o implementacijah, kot je naš na varnost osredotočen vedno zaznavni NPU za pametne telefone. Letos bomo veliko časa posvetili podrobnemu opisovanju robnih implementacij LLM, vključno s prihajajočimi konferencami, ki bodo potekale pozneje to pomlad. Veselimo se srečanja z mnogimi od vas!

Preberite tudi:

Expedera predlaga stabilno razširjanje kot merilo za robno strojno opremo za AI

WEBINAR: Idealen mehanizem nevronske obdelave za vedno zaznavne uvedbe

Območno optimizirano sklepanje AI za stroškovno občutljive aplikacije

Delite to objavo prek:

spot_img

Najnovejša inteligenca

spot_img